Wie sieht derzeit dieses Digitalisierungsangebot aus?
Blinde und sehbehinderte Studierende können jederzeit zu uns kommen oder an die Abteilung für Digitale Services schreiben und Digitalisierungswünsche äußern. Das österreichische Urheberrecht erlaubt es, aktuelle, im Buchhandel erhältliche Werke für blinde und sehbehinderte Studierende zu digitalisieren und auszuliefern – unter der Auflage, das Medium nur für private Zwecke zu nutzen.
Im Idealfall wird der Verlag kontaktiert und das PDF über diesen Weg geliefert, andernfalls wird das Original vor Ort digitalisiert.
Mittels einer OCR-Software wird dann automatisch der Text erkannt.. Eine große Rolle spielt auch, wie gut die Vorlage oder der Scan ist und man hier noch bearbeiten oder gegensteuern kann. Da bekommt man im Laufe der Jahre auch die entsprechende Erfahrung und spart sich oft entsprechend längere Arbeit.
Im besten Falle hat man also die Verlags-PDF, oder?
Genau! Da muss der Text nur mehr extrahiert werden. Im „Normalfall“ muss das Wunschbuch jedoch digitalisiert werden. Das bedeutet: Einscannen sowie Anwendung der Texterkennung (OCR) plus Textkorrektur...
Für die Qualität der Texterkennung ist unter anderem die Schriftart und Schriftgrösse des Originals bedeutsam.
Serifenlose Schriften eignen sich allgemein besser, da Serifen manchmal zu Irritationen führen können – besonders, wenn der Text eng gesetzt ist, die Buchstaben „aneinanderkleben“. Aber das kann sehr, sehr gut korrigiert werden. Der Fine-Reader, mit dem ich da arbeite, kommt damit überraschend gut zurecht.
Ein interessantes Beispiel dazu: In den 50er-Jahren, in der Nachkriegszeit, wurde extrem an Papier gespart, Rohstoffe waren knapp. Diese Bücher sind sehr, sehr oft so gesetzt, dass das Lesen anstrengend ist – mit kleiner, vielleicht noch eng gesetzter Schrift-Type ...
In der Regel werden aber für die Digitalisierung von Studienliteratur aktuelle Bücher verlangt, die normalerweise auch schon professionell gesetzt sind.
Es geht also zunächst darum, einen fehlerlosen Text vom Original-PDF oder durch die korrigierte OCR-Fassung zu bekommen. Das ist erst die „halbe Miete“, denn dann geht es ja weiter.
Die Studierenden bekommen in der Regel auch die PDF-Datei geliefert – bei Teilsehenden genügt das, denn hier wird mit der Lupe gelesen. Meist ist man aber auch auf die Word-oder RTF-Datei angewiesen, die mit den Lesegeräten dann entsprechend „gesteuert“ werden kann. Das ist dann auch der Knackpunkt – die Umwandlung in die Word-Datei, durch die man sich dann „durchnavigiert“.
Ganz entscheidend ist hier die die Erstellung eines automatisch generierten, hyperlinkverknüpften Inhaltsverzeichnisses und die Zuweisung der Formatvorlagen – Überschriften, Fußnoten, Marginalen bei juristischen Werken, die Paginierung allgemein.
Die stimmt ja dann logischerweise nicht mehr, denn die Seitenzahlen weichen ja von PDF auf Word ab, da Letztere ja mehr Seiten hat…
Ja! Hier ist das Zitieren der Originalseite für die Studierenden sehr, sehr wichtig. Aber auch die Fußnoten können hier besonders herausfordernd sein. In den letzten Jahren hat sich da aber bei der Strukturerkennung sehr viel getan - im positivsten Sinne!
Je vielschichtiger ein Text gestaltet ist, umso herausfordernder ist natürlich die Bearbeitung, oder?
Stimmt! Versuch‘ mal mit dem Handy, so einen juristischen Text mit Marginalen und Fußnoten auszugeben! Das ist wie eine Fremdsprache…
Das heißt, bei einem „literarischen Text“ geht das dann natürlich wesentlich besser…
Überschriften, Text – das ist bei Literatur ideal, aber sehr selten. Bei den Digitalisierungsaufträgen handelt es sich fast zu hundert Prozent um Fachliteratur. Leider! Ich hätte gerne auch mal die „Buddenbrooks“. Das wäre super!
Wie geht es dann weiter? Das fertige „Produkt“ kann dann beispielsweise am Endgerät, am PC genutzt werden, oder?
Da hat sich auch einiges gewandelt – es gibt zum Beispiel mobile Abspielgeräte, die die Texte „vorlesen“. Mittlerweile hat sich das Ganze zum Smartphone hin entwickelt.
Es ist aber auch letztlich eine Frage der Qualität der Sprachausgabe… Da tut sich wirklich viel, vor allem im Bereich der Künstlichen Intelligenz. Die Stimmen werden immer angenehmer, klingen zum Teil fast lebendig. Aber irgendwie sind es doch Computerstimmen. Sie sind oft mechanisch. Das geht nicht ins Herz…
Im Grunde wäre also hier noch die nächste Verbesserungsstufe, Pausen in den Texten einzubauen, die Betonung zu verbessern. Im Grunde…
Ja, aber ich kann mir schwer vorstellen, dass so etwas realisierbar ist. Ich hoffe es nicht, denn das ist doch etwas genuin Menschliches und auch von den Personen abhängig. Es muss ja auch etwas geben, was keine Maschine je leisten kann bzw. dürfen können darf.
Vielen Dank für das Gespräch!
Das Interview führte Christian Kössler (ULB Tirol, Öffentlichkeitsarbeit)
Kontakt: thomas.krismer@uibk.ac.at
Mag. Thomas Krismer
Universitäts- und Landesbibliothek Tirol
Abteilung Digitale Services
Innrain 52 - Geiwi-Turm 4DG26
6020 Innsbruck
+43 0512 507 25403
Übrigens: Ein interessantes Arbeitspaket zum Thema "Delivery formats of digitised material for special needs/Digitalisierung für Blinde und Sehbehinderte" findet sich auch auf EODOPEN.