KI-Projekt soll verkohlte Papyrus-Rollen lesbar machen

Erlangen-Nürnberg – Dem Ausbruch des Vesuv im Jahr 79 nach Christus fiel auch eine einzigartige Sammlung von Papyrusrollen zum Opfer. Im 18. Jahrhundert wurden sie wiederentdeckt; die verkohlten und miteinander verklebten Schriften sind jedoch bis heute grösstenteils unlesbar. Ein internationales Projekt unter Beteiligung der Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) will das nun ändern: Durch die Kombination und Weiterentwicklung modernster Techniken wollen die Forschenden die Aufzeichnungen rekonstruieren. Dabei sollen auch KI-Algorithmen zum Einsatz kommen. Der Europäische Forschungsrat (ERC) finanziert das Vorhaben in den kommenden sechs Jahren mit mehr als elf Millionen Euro.
Im Jahr 79 nach Christus brach völlig unerwartet der Vesuv aus, nach 500 Jahren völliger Ruhe. In den Stunden danach rasten mehrfach glühend heisse Ströme aus heissem Gas und Asche die Hänge des Vulkans hinunter, gefolgt von einer Lawine, die den Ort Herculaneum mit einer bis zu 20 Meter dicken Schicht aus Schlamm und Asche bedeckten. Der Naturkatastrophe fiel auch die Villa dei Papiri zum Opfer. Sie beherbergte eine einzigartige Sammlung von Schriftrollen, die erst im 18. Jahrhundert wiederentdeckt wurde.
Als Laie könnte man diese Rollen leicht mit den halb verbrannten Überresten eines Astes verwechseln: Sie sind völlig verkohlt; die einzelnen Schichten, die wie Jahresringe übereinander liegen, sind zudem fest miteinander verklebt und kaum zu trennen. «Bisher wurde etwa die Hälfte der rund 1.800 in der Sammlung inventarisierten Schriftrollen und Schriftfragmente mehr oder weniger erfolgreich entrollt», erklärt Dr. Vincent Christlein vom Lehrstuhl für Mustererkennung an der FAU. «Und selbst, wo das gelungen ist, liessen sich die Inhalte meist nur zum Teil rekonstruieren.»
Ziel: Grössere Treffsicherheit, mehr Speed
Prinzipiell lassen sich die Wicklungen aber auch virtuell trennen – also mit Hilfe des Computers. Dazu werden die verkohlten Papyrus-Rollen mit einem so genannten Micro-CT durchleuchtet. Dabei handelt es sich um ein Röntgenverfahren, das sehr fein aufgelöste dreidimensionale Bilder liefert. Diese digitalen 3D-Scans kann man dann per Software in einem aufwändigen Verfahren zu einer zweidimensionalen Ansicht der Papyrus-Bahn entrollen.
Das Team um die italienische Papyrus-Forscherin Dr. Federica Nicolardi, den US-amerikanischen Experten für die digitale Restaurierung antiker Manuskripte Prof. Dr. W. Brent Seales und Vincent Christlein wird diesen Ansatz in den kommenden Jahren weiterentwickeln. Zentraler Partner des Projekts ist die Nationalbibliothek in Neapel, die nahezu alle erhaltenen Herculaneum-Papyri bewahrt und direkten Zugang zu dieser einzigartigen Sammlung ermöglicht. Für das Gemeinschaftsprojekt mit dem Namen UnLost stellt die EU in den kommenden sechs Jahren rund 11,5 Millionen Euro zur Verfügung. «Wir wollen einerseits den Entroll-Algorithmus verbessern und erheblich beschleunigen», sagt Christlein. «Zudem möchten wir erreichen, dass die KI noch treffsicherer zwischen Schrift und Hintergrund unterscheidet.»
Verborgene Zeichen sichtbar machen
Denn in Micro-CT-Scans heben sich die Zeichen farblich so gut wie nicht vom dunklen Hintergrund ab. Selbst mit ausgefeilten Bildbearbeitungsmethoden lässt sich der Kontrast nur selten so verstärken, dass sie sichtbar werden. «Mehr als einzelne Buchstaben lassen sich so nicht rekonstruieren», betont Christlein. «Dazu müssen wir andere Methoden nutzen.» Er meint damit vor allem Maschinenlern-Algorithmen: Man kann sie mit Tausenden von Papyrus-Regionen füttern, auf denen mit Sicherheit nichts geschrieben steht, und im Gegensatz dazu mit Bereichen, auf denen Buchstaben identifiziert wurden. Die KI-Verfahren lernen dann, Schrift von Hintergrund zu unterscheiden – auch dort, wo das menschliche Auge versagt.
Die Forschenden wollen aber auch andere Durchleuchtungsverfahren erproben. So wird beim sogenannten photoakustischen Verfahren Papyrus mit kurzen Laserimpulsen bestrahlt. Die dabei entstehende Wärme erzeugt feine Ultraschallwellen, die Rückschlüsse auf darunterliegende Strukturen erlauben. Bei den physisch entrollten Fundstücken kommt es zudem mitunter vor, dass Papyrus-Teile an der über ihnen liegenden Schicht kleben bleiben. Mit Hilfe dreidimensionaler Mikroskopaufnahmen möchte das Team solche Fehler identifizieren und zugleich KI-gestützte Vorschläge machen, wohin die so gefundenen Papyrus-Flicken eigentlich gehören.
Die einzige vollständig erhaltene Bibliothek der römischen Antike soll wieder auferstehen
Durch Methoden wie diese erhoffen sich die Beteiligten neue Einblicke in einen einzigartigen Schatz: Die Funde aus Herculaneum haben Schätzungen zufolge einen Umfang von mindestens 4,5 Millionen Wörtern; wahrscheinlich sind es sogar deutlich mehr. Zum Vergleich: Die Bücher der Bibel kommen zusammen auf 750.000 Wörter, die Qumran-Handschriften vom Roten Meer auf gut 800.000. «Es handelt sich um ein Kulturerbe, das seines Gleichen sucht: die einzige vollständig erhaltene Bibliothek der Antike mit überwiegend griechischen und lateinischen Texten, die in ihrem ursprünglichen Fundkontext entdeckt wurde», erklärt Christlein.
Im Forschungsprojekt UnLost sollen nicht nur innovative Ansätze der Digitalisierung sowie der KI-gestützten Analyse entwickelt werden, sondern auch neue Methoden, die Texte aufzubereiten, zu archivieren und der Allgemeinheit zur Verfügung zu stellen. Die Ergebnisse könnten so als Modell für die Restaurierung vergleichbarer Funde rund um den Globus dienen. (pd/mc/pg)