Mit zunehmender Digitalisierung wird auch der Informationsfluss digital. Dies führt auch zur Gründung „Digitaler Bibliotheken“. Aus diesem Grund wird es immer wichtiger auch historische Dokumente mit Frakturschrift digital online verfügbar zu machen.

Scannen ist nur der erste Schritt – Optische Zeichenerkennung (OCR) ist eine Schlüsseltechnologie um historische Inhalte digital für Menschen, Suchtechnologien und andere Analyseverfahren zu erschließen. Eine gute Scanqualität ist jedoch entscheidend für eine gute Frakturerkennung.

PDFs mit OCR erkanntem Text

Mindener-Kreisblatt
1856

006_MK_1856-08-09_001

Mindener-Kreisblatt
1900

234_MK_1900-10-05_001

Mindener-Tageblatt
1939

205_MT_1939-09-02_001

Ibbenbürener Volkszeitung
1899

031_IVZ_1899-03-16_001

Ibbenbürener Volkszeitung
1913

065_IVZ_1913-05-31_001

Ibbenbürener Volkszeitung
1930

149_IVZ_1930-07-01_001