Forscher der University of Notre Dame entwickeln ein neuronales Netzwerk in Kombination mit maschinellem Lernen, um alte Handschriften zu entziffern.
Allein in der Stiftsbibliothek St. Gallen in der Schweiz werden 160.000 Dokumente aufbewahrt, von denen die meisten noch nicht entziffert sind, weil die Zahl der Experten, die alte Schriften entziffern und längst nicht mehr genutzte Sprachen verstehen, niedrig ist.
Alte lateinische Texte
Die Maschine soll nachahmen, wie ein Schrift- und Sprachexperte alte Texte wahrnimmt und in eine moderne Sprache übersetzt. Ein Team um Walter Scheirer, Assistenzprofessor für Computerwissenschaften, hat digitalisierte lateinische Handschriften untersucht, die im 9. Jahrhundert von Schriftgelehrten im Kloster St. Gallen geschrieben und bereits übersetzt wurden. Die Forscher gaben beide Versionen in eine spezielle Software-Schnittstelle ein. Das Team maß dann die Zeiten, die für den Vergleich der einzelnen Teile der Texte nötig sind, um zu verstehen, welche Wörter, Zeichen und Passagen einfach oder schwierig waren.
“Es ist eine Strategie, die normalerweise nicht im maschinellen Lernen verwendet wird. Wir kennzeichnen die Daten durch psychophysische Messungen, das ist eine Methode zur Messung der Verbindungen zwischen physischen Reizen und mentalen Phänomenen, wie zum Beispiel die Zeit, die ein erfahrener Leser benötigt, um einen bestimmten Charakter zu erkennen, die Qualität einer Handschrift zu erfassen oder die Verwendung bestimmter Abkürzungen zu identifizieren”, erklärt Scheirer die wissenschaftliche Vorgehensweise.
Erfolg bei äthiopischen Texten
“Wir informieren das Netzwerk dann über häufig auftretende Schwierigkeiten bei der Wahrnehmung dieser Zeichen und können basierend auf diesen Messungen Korrekturen vornehmen”, unterstreicht Scheirer. Auf dieser Grundlage sei es bereits erfolgreich gelungen, das Programm so anzupassen, dass es äthiopische Texte in eine Sprache mit einem völlig anderen Zeichensatz transkribiert.
“Das Transkribieren von alten Texten könne auch für Manuskripte wichtig sein, die außerhalb des westlichen Kulturkreises angefertigt worden sind”, sagt Hildegund Müller, außerordentliche Professorin für Klassische Philologie an der University of Notre Dame. “Denken Sie nur an Sprachen, die in bedrohten Kulturen verschwinden. Wir müssen diese Texte bewahren, um sie irgendwann einmal mithilfe von Künstlicher Intelligenz (KI) übersetzen zu können.”
www.pressetext.com