XML - Der Schlüssel zu
multimedialen Informationsangeboten
für blinde und sehbehinderte Menschen

Zusammenfassung

Im Mittelpunkt des Artikels stehen die Chancen und Probleme des computergestützten Informationszugangs blinder und sehbehinderter Menschen. Den Schwerpunkt bilden dabei die Problemfelder sowie die Anwendungsbereiche moderner und offener Dokumentenverarbeitungskonzepte auf der Basis von XML zur verbesserten Informationsbereitstellung für diesen Personenkreis.

Zu Beginn der Ausführungen werden die existierenden Informationsbarrieren bei der Nutzung computergestützter Informationssysteme aufgezeigt.

Das zweite Kapitel beschreibt die Gründe für die Entwicklung eines intermedialen Dokumentenformates XML, seine Vorteile und die auf diesem Internetstandard basierenden multimedialen Dokumentverarbeitungskonzepte.

Kapitel drei zeigt die Anwendungsbereiche intermedialer Dokumentverarbeitung für die Produktionsbedingungen von Hörbuch- und Blindenschriftbüchereien. Dazu werden die Arbeit des DAISY Consortiums zur Entwicklung völlig neuer digitaler sprechender Bücher und deren mögliche Einsatzfelder dargestellt. Der Vorschlag eines "single Source - multiple Usage" Konzeptes zur weitestgehend medienunabhängigen Dokumentverarbeitung in einer Blindenbücherei, steht im Mittelpunkt dieses Kapitels. Der Artikel endet mit einer kritischen Wertung der diskutierten Konzepte.

Einleitung

Wer Zimmers Artikelserie in "Die Zeit" über die Digitale Bibliothek [1] gelesen hat, dem dürfte endgültig klar geworden sein, dass die Erfüllung des Traums vom vollständig im Internet abrufbaren Buchbestand weit entfernt ist. Ja, mit großer Wahrscheinlichkeit niemals Realität wird. Alle Bücher in elektronischer Form lesbar und recherchierbar zu machen, ist ein Ziel, welches maximal von Idealisten wie den fleißigen Helfern des "Projekt Gutenberg" verfolgt wird. Wie Zimmer deutlich macht, ist der Aufwand viel zu hoch und würde enorme Ressourcen verschlingen, wollte man jede bereits gedruckte Publikation über das Internet anbieten. Viele Angebote im Netz der Netze bieten neben Speicherplatz und Ladezeit fressender Werbung mehr kurzgehaltene Informationen, die übersichtlich, durchsuchbar und ordentlich miteinander verknüpft sind. Im Vordergrund stehen dabei Informationen über das Wissen und nicht in jedem Fall das vollständig abrufbare Buch. Diese Entwicklung ist verständlich, welcher Computernutzer liest schon mehr als drei Seiten eines Dokumentes am Bildschirm? In aller Regel werden Volltexte am Bildschirm überflogen oder dazu verwandt, umfangreiche und komfortable Textrecherchen auszuführen.

Für Blinde und Sehbehinderte, die unter Nutzung von Braillezeilen, Sprachausgaben und Großschriftsystemen Zugang zu Personalcomputern haben, sind elektronisch publizierte Texte ein in besondererweise interessantes Informationsangebot. Über den PC, ausgerüstet mit einem CD-ROM-Laufwerk und/oder einem Internetanschluss, lassen sich auch von diesen Personenkreis Volltextdatenbanken abfragen, multimediale Nachschlagewerke recherchieren, elektronische Bücher lesen und eine ständig wachsende Zahl von Internetseiten durchstöbern. Wenn..., ja, wenn da nicht so einige Informationsbarrieren beim Zugriff auf diese Daten bestünden.

Auch die Leser gedruckter Blindenschrift und aufgesprochener Hörbücher, die selbst keine Computeranwender sind, könnten von der Digitalisierungswelle in der Verlags- und Druckwelt profitieren. Schließlich setzen die Blindenbüchereien zunehmend computergestützte Verfahren ein, um Punktschrifttexte und Hörbücher zu produzieren. Leider sind viele in der Verlagsindustrie zum Einsatz kommende Dokumentenformate nicht sonderlich gut geeignet, um automatisch in ein für blinde Leser geeignetes Format konvertiert zu werden.

In diesem Artikel soll aufgezeigt werden, welche Informationsbarrieren für Blinde und Sehbehinderte in der digitalen Dokumenentverarbeitung bestehen und welchen Einfluss diese Barrieren auf die Arbeit der Blindenbüchereien haben. Gleichzeitig werden moderne Konzepte der intermedialen Dokumentverarbeitung auf der Basis von XML vorgestellt, die zeigen, wie diese Barrieren abgebaut werden können.

1 Informationsbarrieren bei der digitalen Dokumentverarbeitung

1.1 OCR-Barriere

Wie bereits gesagt, der Aufwand alle Bücher, historische und aktuelle Bestände, vollständig zu digitalisieren ist zu hoch. Das Digitalisieren umfasst hierbei nicht allein das Scannen und Abspeichern der Buchseiten als Bilddaten auf der Festplatte, sondern auch die nach diesem Vorgang durchzuführende Texterkennung (OCR), Strukturierung und Fehlerkorrektur des bearbeiteten Dokumentes. Diese Arbeitsschritte sind aufwendig und unbedingt notwendig, wenn die elektronischen Inhalte flexibel präsentiert und komfortabel zu recherchieren sein sollen. Welche Probleme bei der Texterkennung auftreten können, ist Anwendern sogenannter Lesesysteme (PC der mit einem Flachbettscanner, einer OCR-Software und einer sehgeschädigtengerecht gestalteten Benutzungsoberfläche ausgestattet ist) sehr deutlich. Diese Systeme versagen, wenn die Vorlagen schlecht gedruckt oder komplex und aufwendig gestaltet sind.

Der kritische Leser mag sich an dieser Stelle fragen: Könnten nicht Arbeitszeit und Ressourcen gespart werden, wenn auf das Scannen gedruckter Seiten verzichtet und gleich auf die elektronischen Vorlagen zugegriffen wird?

1.2 Format-Barriere

Die in der Verlagswelt häufig eingesetzten DTP-Systeme wie Pagemaker und QuarkXPress ermöglichen es bislang nicht, aufwendig und ansprechend gestaltete Satzdaten in ein text- und strukturorientiertes Format zu konvertieren. Beispielsweise lässt sich der Text eines Buches, welches im Format QuarkXPress geschrieben wurde, im ASCII-Format abspeichern, jedoch gehen dabei viele Informationen wie Spalteneinteilungen oder Seitenwechsel verloren. Aus diesen durcheinander geratenen ASCII-Daten lassen sich nur mit manuellen Nacharbeiten wieder lesbare Dateien erzeugen.

1.3 Bild-Barriere

Verschärft werden die Probleme bei der Weiterverarbeitung von Satzformaten durch die hierbei übliche Praxis, in die Dokumente eine Fülle von Bilddaten hineinzupacken. Ein Texterkennungssystem ist hierbei chancenlos. Im besten Fall kann wenigstens noch die Bildunterschrift ausgewertet werden. Die Information, die im Bild steckt, kann bei einer Konvertierung nicht weiterverarbeitet werden. Systeme zur Bilderkennung und zum Bildverstehen sind in Entwicklung und werden zukünftig hierbei Einsatz finden.

Selbstverständlich kann und soll Text nicht die Bilder in einem Buch ersetzen. Ein Bild sagt mehr als tausend Worte. Jedoch sind in den Bilddaten häufig auch Zahlen, Buchstaben und Sonderzeichen verborgen. Beispiele hierfür sind mathematische oder andere formale Darstellungen, die in Satzsystemen in aller Regel nur als Bilddaten verfügbar sind und somit bislang bei der Konvertierung in ein strukturiertes Textformat verloren gehen.

Eine Ausnahme stellt hier das in der technischen und akademischen Welt sehr geschätzte LaTeX dar. Dieses auf TeX basierende und frei verfügbare Textsatzsystem bietet eine sehr leistungsfähige Macrosprache,die es dem Anwender ermöglicht, Mathematik, Chemie und vieles andere mehr als Zeichenketten zu beschreiben, in grafischer Form am Bildschirm anzuzeigen und in hoher Qualität auszudrucken. Die Einsatzfelder und flexiblen Anpassungsmöglichkeiten von LaTeX, aber auch die Probleme der Umsetzung grafischer Repräsentation in für Blinde und Sehbehinderte geeignete Form, sollen hier nicht Gegenstand der Betrachtungen sein [2].

1.4 Interaktionsbarriere

Moderne PC-gestützte Lese- und Recherchesysteme sind in aller Regel mit grafischen Benutzeroberflächen ausgerüstet. Durch den Einsatz von Screenreader-Programmen (Software, die die grafische Benutzungsoberfläche in einer textuellen Form über Sprachausgabe und Braillezeile zugänglich macht) können von blinden Anwendern System- und Anwendungsprogramme auf MS Windows 95/98 oder NT genutzt werden. Diese auch als Brückensoftware bezeichneten Hilfsprogramme verwenden Informationen, die vom Betriebssystem und von Anwendungsprogrammen über entsprechende Schnittstellen bereitgestellt werden müssen. Informationen die ohne Berücksichtigung dieser Schnittstellen von der Software auf der grafischen Benutzungsoberfläche ausgegeben werden, sind durch die Brückensysteme nicht in die für den blinden Anwender geeigneten Darstellungen übertragbar.

Zusätzliche Probleme beim Einsatz von Screenreadern bereiten die von den Anwendungsprogrammen häufig angebotenen mausorientierten Interaktionsformen. Verfügt die Anwendungssoftware nicht über tastaturorientierte Bedienmöglichkeiten, so ist der blinde Anwender in seinen Interaktionsmöglichkeiten sehr eingeschränkt. Durch die oben beschriebene Bild-Barriere sind rein auf grafischer Manipulation basierende Interaktionsformen für den Nutzer eines Screenreaders nicht nachvollziehbar.

Die Vielfalt der Interaktionsprobleme führt häufig zu Frustrationen der blinden Nutzer. Jeder blinde Windows-Anwender kennt die Situation: Ein Bekannter hat ein neues multimediales Nachschlagewerk auf CD-ROM, welches er gern am Computer seines sehgeschädigten Freundes ausprobieren möchte. Die Freude ist meist recht kurz. Auch nach erfolgreicher Installation und dem zeitraubenden Trainieren der Icons des neuen Programmes will keine Zufriedenheit aufkommen. Die Benutzungsoberfläche ist so komplex, dass der blinde Anwender lange suchen und trainieren muss, um die gewünschten Funktionen auszuführen. Häufig ist er dabei auf die Hilfe eines erfahrenen Windows-Anwenders angewiesen, der das Anwendungsprogramm konfigurieren kann und möglichst noch die speziellen Anpassungen am Screenreader vornimmt.

Um nicht zu schwarz zu malen, sei hier die Bemerkung gestattet, dass auch viele sehende Computeranwender mit dem Überangebot an Funktionalität in neuer Software ihre Probleme haben. Aus Software-ergonomischer Sicht ist die Funktionsüberfrachtung moderner Programmsystme, ohne gleichzeitig Möglichkeiten zur Individualisierbarkeit oder Vereinfachung anzubieten, wenig sinnvoll. Sie vermittelt zuweilen den Eindruck, dass die Nachfrage der Anwender nach neuen Features und Produkten künstlich erzeugt werden soll.

1.5 MS-DOS-Barriere!?

Aus folgenden Gründen geben derzeit im privaten Bereich blinde Anwender dem in der Zwischenzeit in die Jahre gekommenen Betriebssystem MS-DOS den Vorzug gegenüber den modernen grafischen Alternativen:

Aus diesen Gründen fordern Selbsthilfeorganisationen, dass moderne PC-basierte Informationssysteme auch weiterhin für das Betriebssystem MS-DOS verfügbar sein müssen. Dieser Wunsch ist verständlich, jedoch auf längere Sicht wohl kaum zu realisieren. Hieße dies doch, langfristig blinde Computernutzer vom technischen Fortschritt auszuschließen und Insellösungen zum Status Quo zu erklären.

Mit Linux steht blinden und sehbehinderten Computernutzern ein leistungsfähiges und modernes Betriebssystem zur Verfügung [3]. Aufgrund der kommandoorientierten Bedienmöglichkeiten stellt es eine interessante Alternative dar. Jedoch erfordert die Installation, Konfiguration und Bedienung des Systems fundierte Kenntnisse. Wer mit EMACS, LaTeX und Scriptsprachen vertraut ist, hat mit diesem System eine moderne und allen Anforderungen entsprechende Plattform, die abgesehen von den Möglichkeiten der Grafikverarbeitung, barrierefrei ist.

Zweifellos ist und bleibt der PC mit MS Windows System das am häufigsten genutzte computergestützte Arbeitsmittel im Bürobereich. Deshalb ist es auch für blinde und sehbehinderte Anwender unumgänglich, mit diesem System vertraut zu sein. Gleichzeitig muss dafür Sorge getragen werden, Neuentwicklungen so zu konzipieren, dass bereits existierende Informationsbarrieren abgebaut und neue nicht entstehen können.

Der im nachfolgenden Abschnitt dargestellte Ansatz einer intermedialen Dokumentverarbeitung auf Basis von XML, stellt ein offenes und ausbaufähiges Konzept dar, Informationsbarrieren entgegenzuwirken und eine entscheidende Verbesserung des Informationszugangs zu erreichen.

2 Intermediale Dokumentverarbeitung

2.1 Siegeszug und Grenzen von HTML

Ein Grund für die rasche Verbreitung des Internet ist zweifellos die Einfachheit die hinter dem Konzept des WWW (World-Wide Web) und dem dazugehörigen Dokumentenformat HTML (Hyper-Text Markup Language) steckt. Jeder Computernutzer kann, mit verhältnismäßig geringem Aufwand, eigene Internetseiten im Format HTML erstellen und über einen WWW-Server weltweit verfügbar machen. Noch einfacher ist es, die Seiten mittels eines Web-Browsers aus dem Netz auf die Festplatte eines PC zu laden, die Inhalte anzuzeigen, auszudrucken oder in anderen Anwendungen weiter zu bearbeiten.

HTML bietet Möglichkeiten Texte zu strukturieren (z.B. Untergliederung in Überschriften, Absätze, Aufzählungslisten, Tabellen und Bilder) und zu gestalten (z.B. Festlegung von Schriftart, Schriftgröße und Farbe). Der Autor eines HTML-Dokumentes kann über die Nutzung von Hyperlinks sein Dokument mit Verweisen auf andere Informationen im Internet anreichern. Hyperlinks sind geeignet, Informationen zu strukturieren sowie Navigationshilfen und themenrelevante Zusatzinformationen anzubieten. Nicht zuletzt muss darauf hingewiesen werden, dass HTML und die entsprechenden Web-Browser die Integration von Grafiken und Bildern auf komfortable Weise gestatten. Auch das Einbinden von Video- oder Audiosequenzen ist kein Problem. Nur die Leitungsqualität muss die Übertragung der Daten in entsprechender Geschwindigkeit zulassen. Ansonsten wird aus WWW sehr schnell "Welt weit Warten".

Telefonieren, Radio hören, Fernsehen, Studieren, Einkaufen und fast jede Form des Geldverdienens soll zukünftig per Internet möglich sein. Dies stellt viele Anforderungen an die im WWW eingesetzten technologischen Konzepte, die von der aktuellen Version 4.0 der Formatierungssprache HTML längst nicht erfüllt werden. Die dabei existierenden Grenzen lassen sich anhand der folgenden Forderungen verdeutlichen:

Um eine Internetseite "cool" aussehen zu lassen, ist es nicht ausreichend, die Informationen in HTML auszuzeichnen, die dazughörigen Bilder, Sounds und Animationen einzubinden und das fertige Dokument im Netz zu präsentieren. Dabei immer der neuesten Mode zu entsprechen und sich von den anderen Angeboten abzuheben ist häufig ein wichtiges Ziel. Text wird dazu nicht mit standardisierten HTML-Elementen ausgezeichnet, sondern als Grafik in das Dokument integriert. Eine verständliche Arbeitsweise, berücksichtigt man, dass bei weitem nicht alle in der Grafiker- und Designerwelt üblichen Gestaltungsformen mit dem aktuellen HTML-Sprachumfang umzusetzen sind. Was manche Web-Designer dabei außer Acht lassen ist die Tatsache, dass Text der in einem Bild oder in einer Grafik versteckt ist, nur sehr aufwendig zu extrahieren und zu durchsuchen ist. Auch der Anwender eines textorientierten Web-Browsers kann mit noch so schön gestalteten und ausschließlich als Bitmap verfügbaren Schriftzügen beim Online-surfen nichts anfangen.

Ein Problem, das alle Internetnutzer ärgert ist die mit der Fehlernummer 404 gekennzeichnete Situation: Ein Hyperlink verweist auf eine Adresse im Netz, die nicht mehr existiert. Längst wurde das referenzierte Angebot verändert, jedoch der Verweis auf diese Ressource wurde bei der Änderung vergessen. Schade eigentlich, gern hätte man diesem Hinweis nachgehen wollen, aber HTML kennt keine bidirektionalen Verweise.

Nachfolgend werden derzeit in der Diskussion befindliche Weiterentwicklungen des W3C (World-Wide Web Consortium) dargestellt, die die oben aufgeführten Anforderungen erfüllen.

2.2 XML - Erweiterbare Auszeichnungssprache für elektronische Dokumente

HTML besitzt einen fest definierten Sprachumfang. Die Erweiterungswünsche der Anwender sind vielfältig und von unterschiedlichen Interessen getragen. Die Spanne reicht dabei von Anforderungen der Verlagsindustrie, die eine größere und flexiblere Gestaltungsvielfalt bei den Formatierungsanweisungen sowie einen wirksamen Schutz des Copyrights der Dokumente wünschen, bis zu Forderungen der Betreiber von Mobilfunknetzen, die auch bei geringeren Übertragungsraten ansprechend gestaltete Web-Seiten auf den Funktelefonen ihrer Kunden zur Anzeige bringen wollen.

Um diesen Wünschen gerecht werden zu können, entwickelt das W3C die erweiterbare Auszeichnungssprache XML (Extensible Markup Language), die dem Anwender die Möglichkeit gibt, seinen Anforderungen entsprechend Strukturierungs- und Formatierungsanweisungen zu definieren.

Die Idee ist so neu nicht. Bereits in den 70er Jahren entwickelte Goldfarb mit GML eine verallgemeinerte Auszeichnungsprache. 1986 wurde SGML (Standard Generalized Markup Language) als internationaler Standard veröffentlicht und findet breite Anwendung in Bereichen der technischen Dokumentation und des Dokumentmanagements.

Das 1997 vorgestellte XML ist die vereinfachte Version von SGML. Wie die Entwickler wissen ließen, ist XML, gegenüber seinem großen Bruder, wesentlich einfacher zu implementieren und wird sich somit schnell als nützliches Werkzeug im Internet verbreiten. Was steckt hinter dem Konzept und welche Vorteile bietet es gegenüber HTML?

2.2.1 Trennung von Inhalt, Struktur und Layout

Wie bereits dargestellt ist der Ausgangspunkt des in XML umgesetzten Konzeptes der Wunsch des Anwenders oder einer Anwendergruppe, in seinen/ihren Dokumenten selbst bestimmen zu können, welche Informationen markiert, strukturiert, formatiert und auf welche Weise angezeigt werden.

Die Struktur der Informationen legt der Anwender in einer DTD (Document Type Definition) fest. Die DTD beschreibt die Bausteine oder Strukturelemente sowie deren Beziehungen untereinander, aus denen sich ein Dokument zusammensetzen kann. Je nach Anwendergruppe können dies verschiedene Bausteine sein. Beispielsweise enthält die DTD zur Beschreibung eines Buches Elemente wie Überschriften, Absätze und Abbildungen, aber sicher auch bibliografische Angaben wie Autor, Verlag, ISBN und das Erscheinungsjahr. Die DTD, die bei einem Mobilfunknetzbetreiber zum Einsatz kommt, wird u.a. folgende Angaben enthalten: Telefonnummer, Name des Anrufers, E-Mail-Adresse, Tarifzone und Gesprächsdauer.

Hierbei definiert nicht jeder Anwender seine eigene DTD, sondern greift in aller Regel auf bekannte und bewährte Lösungen zurück. Es gibt TeachML für elektronische Lehr- und Lernmaterialien, MathML zur Darstellung von mathematischen Zusammenhängen und viele weitere Entwicklungen, die sicherstellen, dass jede Interessengruppe ihr eigenes Strukturierungsformat nachnutzen oder für Spezialfälle modifizieren kann.

Wichtig bei der Gestaltung einer DTD ist, dass in ihr nur die erforderlichen Strukturelemente vereinbart werden. Auf welche Art und Weise der Inhalt dieser Elemente formatiert wird, ist hierbei noch nicht festgelegt. Diese Trennung von Inhalt, Struktur und Layout bildet den entscheidenden Vorteil des Konzeptes. Sie ist die Grundvoraussetzung, um die Dokumentverarbeitung intermedial also medienunabhängig zu halten.

2.2.2. Layout-Gestaltung durch Stylesheets

In aller Regel sind Informationen die im Internet angeboten werden nicht ausschließlich für die Online-Präsentation erfasst und aufbereitet worden. Die Daten kommen aus unterschiedlichen Systemen, die in den jeweiligen Unternehmen verwendet werden. Ein Verlag setzt beispielsweise zur Erstellung und Druckaufbereitung seiner gedruckten Publikationen ein propriäteres Textsatz- oder DTP-System ein. Um modernen Ansprüchen gerecht zu werden, hat er gleichzeitig großes Interesse daran, diese Daten in entsprechend aufbereiteter Form auf CD-ROM oder Online anbieten zu können. Ein intermediales Dokumentenformat wie XML bietet ihm die Möglichkeit, die Daten in der für die konkreten Produktionsbedingungen geeignetsten Form vorzuhalten und je nach Medienart unterschiedlich aufzubereiten und anzubieten.

Sollen XML-Dokumente flexibel und in hoher Qualität auf Computerbildschirmen, Handy-Displays, Braillezeilen oder per synthetischer Sprachausgabe ausgegeben werden, so benötigt der eingesetzte Browser mehr als nur die in der DTD definierten Strukturinformationen. Zur flexiblen und verallgemeinerbaren Layout-Gestaltung kann ein XML-Dokument dabei mit Stylesheets verknüpft werden. In ihnen ist festgelegt, in welcher Art und Weise die einzelnen Elemente eines Dokumentes präsentiert werden. Durch die Kaskadierung der Stylesheet-Informationen ist es z.B. möglich, Überschriften je nach Hierarchiestufe unterschiedlich gestaltet anzuzeigen, den Seitenwechsel entsprechend der Kapitelanordnung zu steuern oder arabischen Text entsprechend seiner Schreibweise von rechts nach links anzuzeigen.

Derzeit existieren zwei Konzepte zur Realisierung von Stylesheets im WWW. Die Entwicklung der einfachen Version CSS (Cascading Style Sheets) ist bereits abgeschlossen und kann in üblichen Web-Browsern eingesetzt werden. Mit der Entwicklung von XSL (Extensible Style Sheet Language) verfolgt das W3C das Ziel, den Anwendern ein professionelles Werkzeug zur Gestaltung multimedialer Informationen anzubieten. Die Entwicklungsarbeiten hierzu sind jedoch noch nicht abgeschlossen.

2.2.3 Integration und Synchronisation multimedialer Daten

Eine der wesentlichsten Eigenschaften des WWW ist zweifellos seine Multimedialität. Die eingesetzten Technologien lassen es zu, Text mit Audio- oder Videodaten zu verbinden. Realaudio gestattet schon heute das weltweite Radio hören, in aller Regel in Mittelwellenqualität. Wer die Tagesschau verpasst hat, kein Problem, mit einem Multimedia-PC und einer leistungsfähigen ISDN-Verbindung genügt ein Klick auf www.tagesschau.de. Derzeit raufen sich die Musikverlage die Haare, kann doch jeder Internetnutzer seine Lieblingshits als MP3-Datei in komprimierter Form auf seinen Computer laden und auf CD-ROM oder einer Minidisk speichern. Anmerkung: Die juristischen Aspekte dieser völlig neuen Form des Informationsaustausches sollen hier nicht diskutiert werden.

Sollen bewegte Bilder, akustische Informationen und geschriebene Texte gleichzeitig dem Anwender auf seinem PC zur Verfügung gestellt werden, so ist eine Synchronisation der unterschiedlichen Datenströme erforderlich. Das vom W3C dazu entwickelte Konzept heißt SMIL (Synchronisation Multimedia Interchage Language). Derzeit wird die 2. Version dieser auf XML basierenden Anwendung erarbeitet. Das Prinzip soll im nachfolgenden Beispiel kurz erläutert werden.

Eine Vorlesung soll multimedial im Internet angeboten werden. Das Vorlesungskript wird in XML erstellt. Die Veranstaltung ist auf Video aufgezeichnet und zur Präsentation im Internet aufbereitet. Um nun dem Besucher der virtuellen Lehrveranstaltung die Möglichkeit zu geben, vom Inhaltsverzeichnis des Vorlesungsskripts einzelne Kapitel sowohl in schriftlicher als auch in gesprochener und filmischer Form abrufen zu können, werden die beiden Datenströme über eine SMIL-Datei miteinander synchronisiert.

Eine SMIL-Datei ist im einfachsten Sinne eine Tabelle, die in der ersten Spalte die Adressen aller Strukturelemente der XML-Daten beinhaltet. In der zweiten Spalte der Tabelle stehen die Verweise auf die jeweiligen Filmsequenzen. Die Tabelle kann aus mehr als zwei Spalten bestehen, so dass es möglich ist, auch aus einem abgespielten Film heraus Text anzuzeigen sowie andere Video- oder Audiosequenzen abzurufen.

2.3 Informationsquellen

Es gibt eine ganze Reihe von Büchern zum Thema XML und den darauf basierenden Konzepten. Ein deutschsprachiges ist im Literaturverzeichnis dieses Artikels angeführt [4]. Wer mehr zum Thema wissen will und aktuelle Informationen wünscht, der sei an dieser Stelle auf das Internet selbst verwiesen.

Ein interessanter Einstiegspunkt könnte dabei die Adresse des W3C sein. Unter www.w3.org finden sie die Spezifikationen und viele Zusatzinformationen zu HTML, XML, CSS und SMIL. Von besonderem Interesse für blinde und sehbehinderte Computernutzer dürfte die Web-Seite der WAI (Web Accessibility Initiative) www.w3.org/wai sein. Auf ihr sind neben nützlichen Softwaretips vor allem die Richtlinien zur Gestaltung von Internetseiten, die für jederman nutzbar sind, angegeben.

3 Anwendungsbereiche in den Blindenbüchereien

3.1 DAISY - Mehr als sprechende Bücher
3.1.1 Digitales aus der Hörbücherei

"Wann gibt es Hörbücher aus der Blindenbücherei endlich auf CD?" ist wohl eine der am häufigsten gestellten Fragen bei der Diskussion um neue Formen des Informationszugangs für Blinde und Sehbehinderte. Die einfache Antwort darauf lautet: Dann, wenn die Technologie so weit ausgereift ist, dass sich der hohe Aufwand der Umstellung lohnt und der Nutzen für die Leser diesen Aufwand rechtfertigt.

Eine heute übliche Audio-CD speichert bis zu 74 Minuten Musik oder Sprache. Hörbuchkassetten im deutschen Sprachraum haben eine Spieldauer von 90 Minuten. Ein einfaches unbearbeitetes Überspielen und ausleihen handelsüblicher CDs macht somit keinen Sinn.

In der Computerwelt eingesetzte Kompremierungsverfahren wie MPEG ermöglichen es, die Spieldauer einer CD-ROM auf bis zu 50 Stunden zu erweitern. Die Nachfolgerin der CD, die DVD bietet dazu noch eine erhebliche Erhöhung der Speicherkapazität, so dass das Speichern von Videofilmen und vollständigen Hörbüchern technisch kein Problem darstellt. Aber wie haltbar sind selbstgebrannte CDs? Auf welchen Geräten können sie abgespielt werden? Nach wie vielen Ausleihen sind die CDs so zerkratzt, dass eine Kopie angefertigt werden muss? Sind CDs überhaupt ein sicheres Archivmedium oder müssen hier hochwertige Backup-Medien bzw. digitale Archivsysteme zum Einsatz kommen? Fragen, über die sich nicht nur die großen Hörbüchereien der Welt derzeit den Kopf zerbrechen.

3.1.2 DAISY-Bücher

Was derzeit benötigt wird, sind technische Spezifikationen, die ein weltweit einheitliches Format für sprechende Bücher (Talking Books) definieren. Das DAISY (Digital Audio Information System) Consortium hat sich die Aufgabe gestellt, solche Spezifikationen zu erarbeiten, die entsprechende Referenzsoftware zu entwickeln und die private Wirtschaft darauf zu orientieren, die anerkannten Standards in ihre Produkte zu integrieren.

George Kerscher dem engagierten Projektmanager des DAISY Consortiums ist es zu verdanken, dass als Grundlage für die Erarbeitung eines international anerkannten und einheitlich anwendbaren Standards die offene Auszeichnungssprache XML zum Einsatz kommt. An der Entwicklung der DTBOOK3 (Digital Talking Book V. 3) DTD sind Mitglieder des DAISY Consortiums, die Library of Congress, Hilfsmittelfirmen und die nationale Standardisierungsbehörde der USA beteiligt.

Die Bezeichnung "sprechendes Buch" sollte dabei nicht mit dem Begriff Hörbuch gleichgesetzt werden. DAISY-Bücher bieten mehr als nur das gesprochene Wort. In den USA arbeiten die meisten blinden Computeranwender mit synthetischer Sprache am PC. Eine Braillezeile gehört nicht zur Standardausstattung eines sehgeschädigtengerechten Computers. Somit sprechen auch Textdokumente, wenn sie vom Screenreader vorgelesen werden. Diese Anmerkung weist auf die entscheidende neue Qualität der DAISY-Bücher hin: Der Möglichkeit der Kombination von gesprochener und geschriebener Information. Das derzeit in Entwicklung befindliche Konzept erlaubt es, Bücher in den folgenden Formen zu produzieren:

3.1.3 Hybride Bücher

Die Möglichkeiten sind wirklich vielversprechend. Dabei wird es auch zukünftig nicht möglich oder notwendig sein, jedes Buch vollständig in Sprache und Text aufzubereiten. Viele Hörbücher werden auch weiterhin nur als Audiobuch produziert werden. Jedoch ist das Angebot schon verlockend, von einem Inhaltsverzeichnis Kapitel oder Abschnitte direkt erreichen zu können.

Vor allem der Domäne, Fach- und Sachbuch, werden die aufwendig zu produzierenden Audio- und Textbücher vorbehalten bleiben. Ein solches hybrides Buch bietet dem Anwender Funktionen wie:

Hybride Bücher sind, aufgrund ihrer Gestaltungsvielfalt geeignet, als computergestütztes Lehr- und Lernmittel in Schule, Studium, Ausbildung und Beruf zu fungieren. Sie bilden eine nützliche Ergänzung zu Braillebüchern, Großdrucken, taktiler Abbildungen und tastbaren Modellen. Doch auch der private Anwender kann mittels hybrider Bücher in Nachschlagewerken blättern, Kataloge durchstöbern oder aus einem Kochbuch schnell das gewünschte Rezept heraussuchen.

3.1.4 Wiedergabe von DAISY-Büchern

Um die vielen nützlichen Zusatzfunktionen nutzen zu können, benötigt der Anwender entweder einen PC mit entsprechender Software oder eines der transportablen Abspielgeräte für DAISY-Bücher. Die Chancen stehen derzeit nicht schlecht, dass DAISY-Bücher auf zukünftigen Versionen von Standard-Web-Browsern wie Internet Explorer von Microsoft abspielbar sind. Im Rahmen des SIGTUNA-Projektes entwickelte die JSRPD (Japanese Society for Rehabilation of Persons with Disabilities) einen DAISY-Player, der unter der Internetadresse www.dinf.org kostenlos heruntergeladen werden kann.

Als transportable Abspielgeräte stehen derzeit das japanische Modell PLEXTALK und der kanadische Konkurrent VICTOR zur Verfügung. Beide Systeme dürften in der nächsten Zeit auch auf dem deutschen Markt erhältlich sein.

Gegen Ende 1999 ist mit der Fertigstellung der vom DAISY Consortium in Auftrag gegebenen Aufnahmesoftware zu rechnen. Derzeit läuft der Beta-Test an dem auch deutsche Hörbüchereien teilnehmen. Es liegt auf der Hand, dass zukünftig in den Hörbüchereien das reine Audiobuch gegenüber dem hybriden Buch Vorrang haben wird. Auch werden wohl noch einige Jahre vergehen, bis die Kassette aus dem Ausleihprogramm der Bibliotheken verschwindet. Viele der mittelfristig digital produzierten Bücher werden wohl noch auf die analoge Kassette kopiert und somit ganz traditionell zur Ausleihe kommen.

Im letzten Abschnitt dieses Artikels sollen noch einmal die Vorteile, die in der Nutzung des intermedialen Dokumentenformates XML liegen, aufgegriffen und für die zukünftige Arbeit der Blindenbüchereien diskutiert werden.

3.2 Informationsverarbeitung aus einer Hand

Ausgangspunkt der Überlegungen ist die in XML realisierte Trennung von Inhalt, Struktur und Layout der in einem Dokument gespeicherten Informationen. Auf diese Art wird es möglich, ein Ausgangsdokument bereitzustellen, welches als Quelle für viele von Blinde und Sehbehinderte nutzbaren Medienarten dienen kann.

Wenn die technologischen, materiellen und personellen Voraussetzungen für einen solchen (Single Source - multiple usage) Produktionsablauf geschaffen werden, sind in einer Blindenbücherei aus einem Quelldokument die folgenden Medienarten zu erzeugen:

Nachfolgend werden die generellen technologischen Schritte diskutiert, die das hier charakterisierte Prinzip, Informationsangebote aus einer Hand, beschreiben.

3.2.1 Akquirirung der Daten

Die Daten für ein zu produzierendes Buch können entweder direkt vom Verlag in elektronischer Form beschafft, per Scanner und OCR-Software erzeugt oder auch - keine Seltenheit - von Hand eingegeben werden.

Die Verlagsindustrie zeigt großes Interesse an XML und den verwandten Technologien. Die nächsten Jahre werden zeigen, inwieweit dieses Interesse auch unmittelbar für die verbesserte Bereitstellung von sehgeschädigtengerechten Informationsangeboten genutzt werden kann.

Bis dahin wird das Einscannen der Vorlagen sowie die manuelle Korrektur der Daten ein notwendiger und aufwendiger Arbeitsschritt in diesem Produktionsprozess bleiben.

3.2.2 Strukturierung der Daten

Die Strukturierung der Daten kann gemäß einer XML DTD erfolgen. Mit der vom DAISY Consortium entwickelten DTBOOK3 DTD wird nach ihrer Fertigstellung ein leistungsfähiges, anpassbares und erweiterbares XML-Format zur Verfügung stehen.

Mittels geeigneter Software-Werkzeuge können eingescannte Vorlagen in das Format der DTD gebracht werden. Dieser Prozess ist, wie im vorangegangenen Abschnitt bereits angemerkt, mit verhältnismäßig hohem manuellen Aufwand verbunden (z.B. Korrektur der gescannten Vorlagen und Strukturierung des Dokumentes durch das Einbringen der entsprechenden Markup-Anweisungen). Er unterscheidet sich dabei in keiner Form von den Editierarbeiten ,die bereits beim Einsatz traditioneller Verfahren der Blindenschriftproduktion zur Anwendung kommen. Bei der Anpassung oder Entwicklung geeigneter Werkzeuge kann somit auf umfangreiche Erfahrungen der mit diesem Prozess bereits vertrauten Mitarbeiterinnen und Mitarbeiter zurückgegriffen werden.

Werden die Daten für das zu übertragende Buch in elektronischer Form bereitgestellt, so kann der manuelle Aufwand der Textvorbereitung entschieden gesenkt werden. Der Idealfall wäre, wenn das Buch bereits in einem strukturierten Format verfügbar ist. Eine Konvertierung könnte dann nahezu automatisch erfolgen.

Wie bereits im Abschnitt 1.2 dargestellt wurde, setzen die Verlage derzeit häufig Formatierungs- und Textsatzsysteme ein, die diesen Strukturierungsansatz nicht unterstützen. Dies dürfte sich, wenn auch langsam, ändern. Bis dahin bleibt den umsetzenden Einrichtungen die Möglichkeit, eigene Werkzeuge zur Verminderung des manuellen Aufwands bei Korrektur und Strukturierung der Texte zu entwickeln. Geeignete Ansatzpunkte bieten hier die über das Internet angebotenen Transponierungssdienste wie PDF2HTML access.adobe.com oder viele andere Konvertierungswerkzeuge, die bereits verfügbar oder in Entwicklung sind.

3.2.3 Medienspezifische Formatierung

Sind die in den ersten beiden Schritten auszuführenden Arbeiten weitestgehend medienunabhängig, so wird im letzten Schritt, abhängig von den jeweils zu produzierenden Medienarten, eine entsprechende Formatierung erzeugt. Liegen die Daten, strukturiert nach einer DTD vor, so kann das Ausgangsdokument separat für jedes Ausgabemedium weiterverarbeitet werden.

An erster Stelle stehen dabei die Werkzeuge zur Produktion von Braillebüchern. Vorstellbar sind hier weitestgehend automatisierbare Konvertierungsprogramme die das Buch wahlweise in Basis-, Voll- oder Kurzschrift umwandeln. Fragen des Seitenlayouts, der Einbeziehung von Fremdsprachen oder Übersetzungsmöglichkeiten für mathematische Darstellungen sind nützliche Features der zu schaffenden Programme.

Die Übertragungsprogramme der SBS Zürich sowie das Hagener Braille System bieten die geeignete Grundlage, aus ihnen ein flexibel handhabbares und modifizierbares Konvertierungsprogramm für intermediale Dokumentenformate zu entwickeln.

Zur Produktion eines hybriden Buches ist der Textanteil des Buches auf gleiche Art wie in der Blindenschriftproduktion in das Format der DTD zu bringen. Das Quelldokument kann danach in die vom DAISY Consortium entwickelte Aufnahmesoftware geladen und der Audioanteil des Buches aufgesprochen werden.

Sollen Bücher oder andere Publikationen direkt in elektronischer Form an die Leser weitergegeben werden, so lassen sich die Quelldaten für eine Internetpräsentation in komfortabler Art nach HTML konvertieren. Es ist hierbei ebenfalls möglich, die Quelldaten in Voll- oder Kurzschrift zu übersetzen und sie per Diskette oder CD-ROM den Lesern anzubieten.

Schließlich lassen sich die einmal erstellten Quelldokumente auch unter Nutzung geeigneter Schriftarten, Schriftgrößen und Gestaltungsvorschriften in Großdruck anbieten.

Weitere Anwendungsfelder ließen sich für die Quelldokumente finden. Hier soll abschließend nur die Möglichkeit der Integration in eine Volltextdatenbank angeführt werden.

Die damit aufgezeigte Vielfalt verdeutlicht die technischen Möglichkeiten und nimmt keine Wertung oder Rangfolge einzelner Medienarten vor. Das Prinzip: Informationsangebote aus einer Hand bietet vor allem dem Nutzer, also Leser, die Möglichkeit, sich selbst zu entscheiden, welches Medium und Format er wann und wo einsetzt. Entscheidungen die für jeden sehenden Leser selbstverständlich sind.

3.3 Kritische Wertung

Das oben beschriebene Prinzip stellt einen sehr vereinfachten und wohl auch etwas idealisierten Ansatz dar. Es weist zumindest die folgenden Schwachstellen auf:

Die Technologie der Informationsgesellschaft entwickelt sich in einem rasanten Tempo. Im Gegensatz zu aufstrebenden Firmen der IT-Branche, ist es einer Blindenbücherei nicht möglich, fehlendes Kapital an der Börse zu akquirieren und ausschließlich gewinnorientiert am Markt zu agieren. Wissensdurstige Blinde und Sehbehinderte stellen kein ausreichendes Käuferpotential dar, das mittel oder langfristig einen angestrebten Return of Investmant sichert. Blindenbüchereien sind auch in der digitalen Informationsgesellschaft notwendige und unverzichtbare Einrichtungen, die verläßliche und bewährte Informationsangebote für blinde und sehbehinderte Menschen jeden Alters unterbreiten. Dabei kommt es vor allem darauf an, traditionelle Darstellungsformen wie die Blindenkurzschrift auch in moderne Informationssysteme zu integrieren und moderne Kommunikations-, Bildungs- und Unterhaltungsangebote barrierefrei zu gestalten.

Informationen zum Autor

Thomas Kahlisch ist seit Februar 1999 Direktor der Deutschen Zentralbücherei für Blinde zu Leipzig (DZB). Er studierte in Görlitz, Dresden und Karlsruhe Informatik und promovierte 1998 am Lehrstuhl Mensch Maschine Kommunikation der TU Dresden. Als blinder Computerbenutzer ist er für den Deutschen Blinden- und Sehbehindertenverband im internationalen Projekt DAISY engagiert.

Literaturverzeichnis

[1]
Zimmer, D.: E. Die digitale Bibliothek. Eine Artikelserie für Freunde und Verächter von Computernetzen. Die Zeit, URL: www.zeit.de, 1998. Nachruck in Blindenschrift: DZB-Nachrichten, 01 - 06/1999.
[2]
Kahlisch, Th.: Software-ergonomische Aspekte der Studierumgebung blinder Menschen. Verlag Dr. Kovac, Hamburg 1998, ISBN 3-86064-797-0.
[3]
Friemarei, F.: Den Computer Fühlen und Hören. BLINUX als Wegweiser für neue Benutzerschnittstellen. CT, 4/1999.
[4]
Beame, H.; Mintert, S.: XML in der Praxis. Edison-Wesley, ISBN 3-3827313309, 1999.
Startseite