Digitale Editionen mithilfe von TEI-XML erstellen

Das auf XML basierende Dokumentenformat TEI hat sich in den Geisteswissenschaften zum Standard für die Kodierung und Editierung von Texten entwickelt. Aus diesem Grund nahm die Einführung in TEI-XML einen breiten Raum in der Spring School ein. Um die Grundlagen der Auszeichnungssprache kennenzulernen, haben wir Urkunden zur Gründung der Paderborner Jesuitenuniversität kodiert.

TEI-XML hat den großen Vorteil, dass man verschiedenste Texte einheitlich formatieren kann. Mittels der Tags ist eine einfache und doch klare Strukturierung des Textes möglich. Anders als bei Dokumenten von Textverarbeitungsprogrammen sind XML-Dateien relativ frei in der Benutzung. So ist man nicht auf eine spezielle Software angewiesen. Dies ist vor allem im Hinblick auf eine langfristige Nutzung von Bedeutung. TEI-XML-Dateien können zudem relativ einfach in andere Formate wie PDF, XDOC, ODT oder XHTML umgewandelt werden.

Indem man eine TEI-Edition erstellt, führt man im Grunde eine erste Quellenbeschreibung und -kritik durch. So werden Namen, Berufe, Daten und Orte gekennzeichnet. Auch Absender und Adressaten können mit Tags kenntlich gemacht werden. Die Auszeichnungen (englisch Markups) geben dem Text eine Struktur. Gerade bei der Formatierung des Textes besteht jedoch immer die Gefahr einer eigenen Interpretation, da nicht eindeutige Darstellungen falsch gedeutet werden. So stellte sich bei einer der von uns zu editierenden Urkunden die Frage, ob ein Wort durchgestrichen oder lediglich unsauber geschrieben war. Dies ist jedoch ein generelles Problem und nicht speziell auf die Arbeit mit TEI-XML bezogen. TEI-XML hat in einem solchen Fall den Vorteil, dass Uneindeutigkeiten oder Unsicherheiten durch bestimmte Tags deutlich gemacht werden können, ohne dabei den Textfluss zu stören.

Im Header-Bereich können zudem die Metadaten wie Autor, Entstehungsort, Provenienz und evtl. Zustand der Quelle eingetragen werden. Durch Attribute wie „type“ ist es möglich, genauer auf einzelne Personen, Orte und andere Begriffe einzugehen. Für die spätere Textuntersuchung mittels Distant Reading ist außerdem die Vergabe von IDs nützlich. So kann gezielt nach Personen und Orten gesucht werden. Außerdem ist es so möglich gleichnamige Personen und Orte zu unterscheiden sowie unterschiedliche Namen mittels der ID einer Person oder einem Ort zuzuschreiben. Gleichzeitig können diese Personen und Orte im Header genauer beschrieben werden. Interessant ist in diesem Zusammenhang auch die Möglichkeit, eine Verbindung zur Gemeinsamen Normdatei herzustellen, indem man die entsprechenden Kennnummern angibt.

Durch die Möglichkeiten, unterschiedliche Texte zu kodieren und Informationen zum Text durch Tags und Metadaten zu speichern, eignet sich TEI ideal für die Zusammenstellung und das Editieren eines Textkorpus. Dank der Markups können Texte mit TEI-XML nicht nur strukturiert, sondern auch historisch-kritisch analysiert werden.

Insgesamt war die Arbeit mit TEI sehr aufschlussreich und interessant. Sie lernte ich zum ersten Mal die Schwierigkeiten einer editorischen Textarbeit kennen. Probleme und Fragen bei der Erstellung eines Textkorpus wurden ebenfalls sichtbar. Zugleich erhielt ich durch die Arbeit mit TEI einen neuen Zugang zu den Quelltexten. Ich halte die Arbeit mit TEI-XML im heutigen sogenannten digitalen Zeitalter für sehr wichtig, da sie die modernen technischen Möglichkeiten auf ideale Weise für die kultur- und geisteswissenschaftliche Textanalyse fruchtbar macht. So können Formatierungen des Textes durch Markups transparent gekennzeichnet und umgesetzt werden.

Das Einfügen ergänzender Informationen und die Erläuterung zentraler Begriffe im Header machen die grundlegenden Textarbeiten einfacher. Zugleich verlangt die Erstellung einer solchen Edition ein umfangreiches Fachwissen sowie eine genaue Planung. Nur so kann ein gründliches Ergebnis erzielt werden. Insbesondere auch die Vereinheitlichung aller Tag-Begriffe ist hier von entscheidender Bedeutung, da nur so ein wissenschaftlich brauchbarer Textkorpus entsteht. Damit dies sichergestellt und auch die Wohlgeformtheit gewährleistet ist, muss eine intensive Einarbeitung erfolgen. Trotz der doch oft sehr kleinteiligen und diffizilen Arbeit, würde ich die Arbeit mit TEI als gewinnbringend bezeichnen, vor allem auch, da so eine wichtige Grundlage für spätere weiterführende Untersuchungen am Text gelegt ist.

Durch die schnelle und problemlose Verbreitung von TEI-Editionen über das Internet können die Texte einem großen Leserkreis präsentiert werden. Damit trägt die wissenschaftliche Digitalisierung von Texten mittels TEI-XML zur Transparenz und Zugänglichkeit von wichtigen Quellen bei.

Die uns gestellten Aufgaben umfassten die Beschreibung des Siegels und die Auszeichnungen von Abkürzungen im Text.

Die Beschreibung des Siegels durch das Element . (Klicken Sie auf das Bild, um es zu vergrößern.)

Ich habe drei Abkürzungen im Text mit <abbr> markiert und diesen Tags das Elternelement <choice> zugeordnet. In dieses habe ich wiederum zusätzlich das Kindelement <expan> eingefügt, welches die Abkürzung auflöst:

Schreibe einen Kommentar