ELAN

Was ist ELAN?

Eudico Linguistik Annotator (Eudico Linguistik Annotator) ist ein Transkriptions- und Annotationstool insbesondere für Videodateien. Dieses Programm eignet sich besonders für die Annotation multimodaler Kommunikate, wenn es darum geht, die Kompositionalität von Bild, Sprache und weiteren akustischen Ressourcen aufzuschlüsseln. Transkribierte Inhalte können mit nahezu unbegrenzt vielen Annotationen analytisch aufgeschlüsselt werden. Die Annotationen lassen sich in vielen verschiedenen Formaten exportieren und können so mit weiteren „LinguTools“ wie Praat ausgewertet werden. ELAN wurde vom Max-Planck-Institut für Psycholinguistik entwickelt.

Merkmale im Profil

  • vornehmlich geeignet für die Transkription von Videomaterial (Bild und/oder Ton)
  • Video- und Audiodateien lassen sich leicht in das Programm einpflegen
  • Bild- und Tondateien müssen getrennt generiert werden
  • es können zu einem Video auch mehrere Tondateien (Sprecher, Musik usw.) eingepflegt werden
  • es können mehrere Videos eingepflegt werden
  • Transkription wird erleichtert durch Geschwindigkeitsregulierung
  • einzelne Tondateien können jeweils ein- oder ausgestellt werden
  • die Tonspur wird mittels eines Oszillogramms visualisiert
  • Annotation und Segmentation transkribierter Inhalte in beliebig vielen Zeilen möglich
  • bis zu vier Videodateien können mit einer Annotation verknüpft werden.
  • online verfügbar als Freeware
  • offline nutzbar
  • für alle Betriebssysteme geeignet
  • Mediaframework muss funktionieren
  • Anleitungen sind vorwiegend auf Englisch online verfügbar

Anwendungsbeispiel:

In dem folgenden Anwendungsbeispiel soll untersucht werden, wie Geräusche in einem Erklärvideo eingesetzt werden. Insbesondere soll herausgefunden werden, welche Leistung Geräusche im Textzusammenhang des Erklärens erbringen, mit welchen Funktionen sie assoziiert sind. Dazu ist es erforderlich, zunächst alle kommunikativ wirksamen Ressourcen zu transkribieren. Dazu zählen der gesprochene Text, die visuell gegebenen Inhalte und die eingebauten Geräusche und Töne. Das Transkribieren ermöglicht es, Bezüge und Relationen zwischen z.B. einem Geräusch und dem gesprochenen Inhalt zu erfassen. Mittels Annotationen können dann wiederholt auftretende Gebrauchsweisen von Geräuschen in ihrer Funktion klassifiziert werden.

Das Vorgehen

Für die Transkription und Annotation eines audiovisuellen Kommunikats sind Ton und Bilddateien getrennt zu generieren und einzupflegen. Bilddateien werden im avi-Format benötigt, während Tondateien im wav-Format erforderlich sind. Für das Anwendungsbeispiel wurden drei Dateien erstellt: eine Videodatei und zwei Tondateien; je eine mit Gesprochenem und je eine mit Geräuschen.

Auswahl der zu bearbeitenden Dateien in ELAN

Nach der Auswahl der benötigten Dateien öffnet ELAN ein Projekt. Im Reiter „Steuerung“ im rechten Fenster können die Tondateien ein- und ausgestellt werden sowie weitere für das Transkribieren hilfreiche Einstellungen vorgenommen werden.

Beispielansicht der Benutzeroberfläche in ELAN (multimodale Annotation)

Für die Analyse der multimodalen Komposition von Bild, Sprache und Geräusch wurden zunächst die visuellen und akustischen Zeichenressourcen transkribiert. Dabei muss zunächst für das Bild, die Sprache und die Geräusche je eine Zeile („Tier“) angelegt werden.

Drei Annotationsspuren („Tiers“) für das Bild, die Sprache und die Geräusche

Durch das Markieren von Auszügen im Oszillogramm (violett) wird die Zeiteinheit ausgewählt, für die dann eine Transkription in der entsprechenden Zeile erstellt werden kann. Den so erzeugten Segmenten können dann Annotationen (grammatische, semantische oder pragmatische Merkmale) zugeordnet werden. In dem Beispiel wurden der gesprochene Text, die Bilder und die Geräusche transkribiert. Anschließend wurden Zeilen für die Annotationen angelegt und die Geräusche bezüglich ihrer semantischen und textpragmatischen Leistung klassifiziert.

Gesamtdarstellung einer multimodalen Annotation in ELAN

Die vorgenommenen Transkriptionen und Annotationen können in verschiedenen Formaten exportiert werden. Das ermöglicht es, die gewonnenen Daten mit weiteren Tools auszuwerten oder für eine Präsentation aufzubereiten. Für das Exportieren der Daten in ein Excel-Format kann die „Tabulator-begrenzter Text“-Funktion genutzt werden. Mittels Excel lassen sich dann beispielsweise Frequenzen einzelner Funktionstypen von Geräuschen statistisch ermitteln und auch in einem Diagramm veranschaulichen.

Weiterführende Links:

Die jeweils aktuellste Version ist hier erhältlich:

https://tla.mpi.nl/tools/tla-tools/elan/download/

User Guide und Manuals können hier runtergeladen werden:

https://tla.mpi.nl/tools/tla-tools/elan/

Eine Kurzanleitung auf Deutsch stellt das IDS Mannheim zur Verfügung:

http://prowiki.ids-mannheim.de/pub/GAIS/TranskriptionEditoren/Kurzanleitung_fuer_ELAN.pdf

Video-Tutorial: