Zeitungsdigitalisierung

Warum soll digitalisiert werden?

Gerade Zeitungen dokumentieren neben der internationalen auch die regionale und lokale Geschichte, Politik, Kultur und Gesellschaftsfragen. In letzter Zeit wächst auch das Interesse der Jugend an lokalen Informationen. Dies ist auch ein Grund, den Zugang zu den Zeitungsarchiven der regionalen Presse zu verbessern. Weder bei Google noch bei anderen internationalen Suchmaschinen werden die Informationen aus dem Verbreitungsgebiet der regionalen Zeitungen entsprechend zu finden sein. Diese wird in kaum einer Quelle so gut abgedeckt wie in den Lokalzeitungen.

Gründe für die Digitalisierung von Zeitungen

Das Archiv einer Lokalzeitung bietet unzählige Vermarktungsmöglichkeiten:

  • Die Archivbestände, die sehr oft vom Zerfall bedroht sind, werden geschont. Das Thema „Bestandserhaltung“ wird hier angesprochen
  • Ein wichtiger, meist wenig beachteter Aspekt ist die Zeitgewinnung bei qualitativ hochwertigen Rechercheergebnissen. Die Recherche im digitalen Archiv dauert Sekunden, die Suche in den Büchern kann Tage dauern bis man fündig wird
  • Vermarktung über Geburtstagszeitungen
  • Vermarktung über ePaper
  • Das digitale Archiv als Werbeträger benutzen. Jede aufgerufene Seite wird mit Werbung verbunden, wodurch zusätzliche Werbeeinnahmen erzielt werden
  • Die Recherche für Firmengeschichten kann auf Bestellung angefertigt werden und als Buchgeschenk für Vorstände, Geschäftsführer Verwendung finden
  • Für die Erstellung von Vereinsgeschichten, können ebenfalls auf Bestellung als Buch zu Vereinsjubiläen produziert und vermarktet werden
  • Für die Ahnenforschung
  • Historische Nachforschungen
  • Eine Bereicherung des Geschichtsunterrichts in Schulen könnte die kostenfreie Nutzung des  Zeitungsarchivs sein, dies führt zu einer Verbreiterung der Nutzung und Leserbindung sowie zur Abonnentengewinnung

 

XML & PDF

Mit Informationen ist es wie mit der Energie: Sie verpuffen, wenn man sie nicht richtig behandelt. Ebenso wenig wie Energie lassen sich Informationen aus dem Nichts gewinnen. Daher ist es wichtig, im gesamten Arbeitsablauf jede nur mögliche Information zu erhalten. Dies beginn bereits beim Scannen. Nur mit sorgfältig gescannten Vorlagen, die nach Möglichkeit alle verfügbaren Informationen enthalten, und nicht relevante Informationen wie z.B. Verschmutzungen, unterdrücken, kann eine qualitativ hochwertige Texterkennung (OCR) stattfinden. Aber auch nach der OCR sollten alle verfügbaren Informationen erhalten bleiben.
Ein Format verspricht dies im besonderen Maße: XML. In XML können beliebige Bestandteile durch logische Markierungen gekennzeichnet und festgehalten werden. Im Gegensatz zu PDF lässt sich auch anscheinend Unwichtiges, was sonst verloren ginge, abspeichern und zur späteren Verwendung wieder aktivieren. Dies ist besonders bei der Artikel-Erkennung wichtig. Nicht nur der Text, sondern der gesamte Kontext, in dem sich der Artikel befindet, muß erhalten bleiben. PDF ist auf eine optimale Reproduktion des Erscheinungsbildes ausgerichtet. Diesen Kontext aber nur aus dem Erscheinungsbild automatisch wiederzufinden, ist so gut wie nicht möglich.