Artikelseparierung
Die von PPS entwickelte Software Automatische-Artikel-Separierung (AAS) strukturiert die aus den nativen FR-XMLs generierten Blöcke mit Hilfe komplexer Algorithmen und verschiedener Analysemethoden und ordnet sie der richtigen Lesefluß zu. Außerdem werden Werbung herausgefiltert und Todesanzeigen erkannt und entsprechend getagged. Darüber hinaus erkennt die AAS durch eine typografische Analyse Untertitel, Haupttitel, Untertitel, Vorspann und den Artikeltext sowie Bildunterschriften und tagged sie entsprechend.
Auf Wunsch liefern wir auch msh Web:digiPaper-, DC-X- und fink & PARTNER huGO-konform.
Wir analysieren die folgenden Artikelelemente:
- Dachzeile
- Titel
- Untertitel
- Vorspann
- Bildunterschrift
- Bilder
- Artikeltext
- Autoren
- Ressort
Artikeltypen die wir kennen
Durchschnittliche Genauigkeit unserer Erkennung in Tageszeitungen
Abhängig vom Layout der Seite, der Qualität der einzelnen Seitenelemente und der Druckqualität.