Transkribus” so heißt das Computerprogramm, das eines Tages historische Handschriften präzise entschlüsseln können soll. Ein EU-Projekt stellt nun die experimentelle Version dieser Software frei zur Verfügung. Die Entwickler hoffen auf eine breite Nutzerschaft, durch deren Feedback sie die Software und die zugehörige Serviceplattform weiter verbessern können.
Bereits seit einigen Jahren arbeiten Forscher daran, digitalisierte historische Dokumente vom Computer automatisch lesen zu lassen. „Die Grundlagenforschung zur Handschriftenerkennung ist schon recht weit fortgeschritten. Nun geht es darum, diese Forschungsergebnisse auch für eine breite Öffentlichkeit nutzbar zu machen”, sagt Günter Mühlberger von der Universität Innsbruck. Mit seinem Team arbeitet er dazu am Aufbau der Serviceplattform transkribus.eu und der zugehörigen Software. „Mit den von der Technischen Universität Valencia und dem Nationalen Forschungszentrum in Athen gelieferten Algorithmen können wir heute bereits 70 bis 80 Prozent eines Dokuments automatisch entziffern.”
Software muss trainiert werden
Doch es gibt immer noch Probleme: Das oft knifflige Erscheinungsbild historischer Dokumente, die unterschiedlich geformten Handschriften, aber auch die verschiedenen Sprachen, sorgen für Schwierigkeiten. „Das System muss zunächst einmal erkennen, wo auf einem Dokument ein Text steht und die einzelnen Zeilen richtig erkennen – eine technische Herausforderung, die nicht zu unterschätzen ist”, sagt Mühlberger. Deshalb ist nun offenbar „learning by doing” gefragt: Die eingesetzten Computeralgorithmen müssen gleichsam trainiert werden, um die Qualität der Handschriftenerkennung zu steigern. „Deshalb wollen wir nicht nur Geisteswissenschaftler einladen, die neue Infrastruktur zu nutzen, sondern auch die breite Öffentlichkeit. Je mehr mit unseren Programmen zur Handschriftenerkennung gearbeitet wird, umso besser werden diese Algorithmen”, so Mühlberger.
Das Vorhaben wird von insgesamt 13 europäischen Partnern getragen und von der Europäischen Union mit insgesamt 8,2 Millionen Euro gefördert. Letztlich ist das Ziel, in den nächsten Jahren Katasterbände, Kirchenbücher, Briefe und viele weitere Arten historischer Dokumente computerlesbar zu machen. Die Forscher wollen dafür zukünftig auch eine App für Smartphones anbieten, mit der Nutzer Handschriften direkt einscannen können. „Alle diese digitalisierten Handschriften können dann am Computer durchsucht werden. Mittels der automatisierten Schreibererkennung kann man zum Beispiel in den Archiven auch nach anderen Handschriften einer bestimmten Person suchen, was bisher so nicht möglich war”, sagt Mühlberger
Was schrieb der Urgroßvater in Kurrentschrift?
Auch für Laien könnte die Technologie interessant werden, betonen die Entwickler: Wer beispielsweise einen in Kurrentschrift verfassten Brief des Urgroßvaters entziffern möchte, könnte digitale Unterstützung erhalten. Eine experimentelle Version der Software steht nun im Internet zum Download zur Verfügung: Jeder Interessierte kann sich auf der Website transkribus.eu registrieren lassen und das Programm ausprobieren.