In diesen Akten, den sogenannten Grundbuchblättern, verbergen sich die Schicksale von rund 90.000 jungen Tirolern, Südtirolern und Trentinern, die im späten 19. Jahrhundert ihren Wehrdienst in der k. u. k. Armee geleistet haben. Dieser besondere Bestand ist nicht nur für die Wissenschaft interessant, sondern auch für viele Familienhistoriker. Aufgrund des großen Interesses wurden diese Daten schon bisher stark nachgefragt. Möglich gemacht wurde das Projekt des Tiroler Landesarchivs durch die Zusammenarbeit mit der Universität Innsbruck sowie der Europäischen Genossenschaft READ-COOP SCE, die die Plattform Transkribus betreiben. In Transkribus können handschriftliche Dokumente mittels künstlicher Intelligenz automatisiert erkannt werden.
Großangelegte Digitalisierung
Das Projekt wurde in mehreren Etappen durchgeführt. Im Jänner und Februar 2020 wurden die Grundbuchblätter aus Südtirol und Trentino und im Februar und März 2021 die Grundbuchblätter aus Nordtirol gescannt. Insgesamt handelte es sich um etwas mehr als 98.000 Scans, wobei jeder Scan jeweils die erste Seite eines Aktes zu einer Person darstellt. Jeder Akt umfasst meist mehrere Blätter, die mittels Klammern oder Klebeband zusammengefasst wurden. Aufgrund eines ansonsten vielfach erhöhten Arbeitsaufwandes wurde jeweils nur die erste Seite des Aktes digitalisiert. Im Rahmen eines On-Demand Verfahrens können die restlichen Seiten gegen eine kleine Gebühr bestellt werden. Für die Digitalisierung wurden mehrere Scanzelte eingesetzt, durchschnittlich waren zwischen fünf und sieben Studierende im Einsatz. Mittels der DocScan App wurden die Seiten nicht nur gescannt, sondern auch zugeschnitten und von den Bearbeiter*innen sofort in die Transkribus Plattform hochgeladen. Die Benennung der Dateien erfolgte entsprechend der Beschriftung der Originalkartons. Der komplette Bestand konnte so in weniger als 20 Arbeitstagen komplett digitalisiert werden.
Automatische Erkennung
In einem weiteren Schritt wurde ein Spezialmodell für die Erkennung des Layouts trainiert. Hier kam das Tool P2PaLa zum Einsatz. Da es sich bei den Grundbuchblättern um komplexe Formulare handelt, die sich im Laufe der Jahre veränderten und zum Teil sehr uneinheitlich sind, beschränkt sich die Handschriftenerkennung auf den Familien- und Vornamen, den Geburtsort und das Geburtsjahr. Diese drei Felder, die in allen Formulartypen vorhanden sind, wurden mit mehreren 100 Beispielen trainiert.
Parallel zur Erstellung des Layout-Modells wurde auch ein spezielles Handschriftenmodell trainiert, um die Familien- und Vornamen zu erkennen. Hierfür wurden von jedem Dokument des Südtiroler Bestandes die 10 ersten Blätter manuell transkribiert sowie einige Dokumente vollständig. Weiters wurden noch aus anderen Projekten, wie dem Franziszeischen Kataster ebenfalls Namensdaten hinzugefügt und das allgemeine Modell Transkribus German Kurrent M2 als Basismodell verwendet.
Die Erkennungsqualität von rund 89% ist angesichts der doch recht herausfordernden Formularfelder, der vielen unterschiedlichen Schrifttypen und Schreiber, sowie der relativ geringen Zahl an Trainingsdaten, zufriedenstellend – soll aber in den nächsten Wochen noch einmal wesentlich verbessert werden. Die automatisierte Verarbeitung wurde direkt in der Plattform durchgeführt.
Der letzte Teil bestand dann in der Verfügbarmachung mittels read&search. Ein Vorgang, der innerhalb kürzester Zeit abgeschlossen werden konnte, da die Dokumente bereits in Transkribus liegen und nur die entsprechenden Bilder und Texte für die Webseite zur Verfügung gestellt werden mussten. Die Grundbuchblätter des Tiroler Landesarchivs sind nunmehr online abrufbar. Das Projekt soll im Laufe der kommenden Monate um eine Crowd-Sourcing Komponente erweitert werden. Mittels des gerade in Entwicklung befindlichen Tools Citizen@Science sollen interessierte Benutzer*innen die Möglichkeit erhalten, sich für die freiwillige Mitarbeit bei der Verbesserung der Texterkennung sowie der kompletten Erfassung der Formulardaten zu melden und so einen Beitrag zur leichteren Verfügbarkeit historischer Daten leisten können.
(Günter Mühlberger/Redaktion)
Links
- Grundbuchblätter des Tiroler Landesarchivs
- Tiroler Landesarchiv
- Grundbuchblätter Online
- Transkribus
- READ-COOP SCE