Eizelartikel

Einzelartikelseparierung

Die Automatische-Artikel-Separierung (AAS) – eine von PPS entwickelte Software – strukturiert die aus den FR nativ XMLs erzeugten Blöcke durch komplexe Algorithmen sowie diverse Analyseverfahren und ordnet diese den korrekten Lesefluss zu. Ebenso wird Werbung herausgefiltert und Todesanzeigen erkannt und entsprechend getagged. Desweiteren erkennt die AAS durch eine typografische Analyse Dachzeilen, Haupttitel, Untertitel, Vorspann und den Artikeltext sowie Bildunterschriften und tagged diese entsprechend.

Wir liefern auf Wunsch auch msh Web:digiPaper-, DC-X- und fink & PARTNER huGO-konform.

 

Folgende Artikelelemente analysieren wir:

  • Dachzeile
  • Titel
  • Untertitel
  • Vorspann
  • Bildunterschrift
  • Bild
  • Text
  • Autoren
  • Ressorts
  • Rubriken

 

Artikelsorten die wir erkennen:

Redaktionelle Artikel 98%
Werbung 65%
Todesanzeigen 87%
Bilder und Bildunterschriften 90%

 

Durschnittliche Genauigkeit der Erkennung bei Tageszeitungen:

Lesefluss des Artikels 80%
Layouterkennung 87%
OCR Erkennung 99.9%

Abhängig von der Gestaltung des Seitenlayouts, der Qualität der einzelnen Seitenelementen, sowie der Druckqualität.