Eizelartikel

Artikelseparierung

Die von PPS entwickelte Software Automatische-Artikel-Separierung (AAS) strukturiert die aus den nativen FR-XMLs generierten Blöcke mit Hilfe komplexer Algorithmen und verschiedener Analysemethoden und ordnet sie der richtigen Lesefluß zu. Außerdem werden Werbung herausgefiltert und Todesanzeigen erkannt und entsprechend getagged. Darüber hinaus erkennt die AAS durch eine typografische Analyse Untertitel, Haupttitel, Untertitel, Vorspann und den Artikeltext sowie Bildunterschriften und tagged sie entsprechend.

Auf Wunsch liefern wir auch msh Web:digiPaper-, DC-X- und fink & PARTNER huGO-konform.

Wir analysieren die folgenden Artikelelemente:

  • Dachzeile
  • Titel
  • Untertitel
  • Vorspann
  • Bildunterschrift
  • Bilder
  • Artikeltext
  • Autoren
  • Ressort

Artikeltypen die wir kennen

Redaktionelle Artikel 98%
Werbung 65%
Todesanzeigen 87%
Bilder und Bildunterschriften 90%

Durchschnittliche Genauigkeit unserer Erkennung in Tageszeitungen

Lesefluß des Artikels 80%
Layoutanalyse 87%
OCR-Erkennung 99.9%

Abhängig vom Layout der Seite, der Qualität der einzelnen Seitenelemente und der Druckqualität.