Voyant macht die quantitative Textanalyse schnell und einfach

Ein wichtiger Bereich im Rahmen des wissenschaftlichen Arbeitens ist die Analyse der Quellentexte. Neben der inhaltlichen Auswertung kann auch das sogenannte Distant Reading zu wichtigen Erkenntnissen führen. Dabei handelt es sich um eine statistische und quantitative Analyse von Texten. Diese Auswertung lässt sich zwar prinzipiell auch manuell durchführen, doch ist dies mit einem großen Arbeits- und Zeitaufwand verbunden. Computerprogramme können einem diese Arbeiten abnehmen. So war die linguistisch-quantitative Auswertung von Texten der erste Einsatzbereich von Digitaltechnik in den Kulturwissenschaften und bildete damit die Grundlage der Digital Humanities.

In der Spring School erhielten wir die Aufgabe, insgesamt 13 Reden von Adolf Hitler durch das Distant Reading im Hinblick auf religiöse Begrifflichkeiten und Deutungsmuster auszuwerten. Diese 13 Reden stammen alle aus der Zeit der NS-Herrschaft, wobei aus jedem Jahr jeweils eine Rede übernommen worden ist. Dadurch ergibt sich ein relativ breiter zeitlicher Kontext. Dies erlaubt es, das allgemeine Auftauchen von religiösen Vokabeln in Hitlers Rhetorik zu erfassen. Ein zu enger Zeitraum hätte womöglich keine allgemeingültige Aussagekraft gehabt, da die Abhängigkeit der Wortwahl und der Themen von konkreten Einflüssen nicht herausgestellt werden könnte. Zugleich können durch die Wahl eines großen Zeitraums auch gewisse Trends dargestellt werden.

Für unsere Textanalyse haben wir auf das webbasierte Open-Source-Programm „Voyant Tools“ zurückgegriffen. Die Software zeichnet sich durch eine einfache Benutzbarkeit und eine große Vielfalt an Darstellungsformen aus. Die Texte lagen uns als txt-Dateien vor und konnten zusammen bei Voyant hochgeladen werden.

Mithilfe der Software habe ich die Texte nach verschiedenen Begriffen durchsucht und die Ergebnisse grafisch dargestellt. Als erstes Suchwort wählte ich den Begriff „gott*“. Das Stern-Symbol sorgt dafür, dass Voyant nach allen Wörtern sucht, die mit dem Begriff „gott“ beginnen, sodass also auch Deklinationen und Komposita erfasst werden. Dabei zeigt sich, dass es in den Reden von 1939 und 1940 einen deutlichen Peak gab. Insgesamt je zwölf Mal finden sich in diesen beiden Reden Begriffe, die das Wort „gott“ enthalten. In den Ansprachen, die aus der Anfangs- und Endzeit der NS-Diktatur stammen, tauchen Worte mit „gott“ dagegen kaum oder gar nicht auf. Insbesondere die Reden ab 1943 sparen den Begriff bis auf eine Ausnahme vollkommen aus. Die Gründe könnten in der angespannten und sich zunehmend verschlechternden Kriegssituation liegen. Vor allem zu Beginn des Krieges findet das Wort „gott“ sehr häufig Verwendung. Dies deutet daraufhin, dass der Optimismus und der Glaube an eine göttliche Vorsehung des Krieges bei vielen Nationalsozialisten sehr stark populär waren. Hitler konnte so die Massen begeistern, während später vor allem Durchhalteparolen die Ansprachen bestimmten.

Lässt man sich mittels microsearch die Textlängen grafisch anzeigen und die Textbereiche farbig markieren, die „gott*“ enthalten, fällt aber außerdem auf, dass besonders die Rede von 1939 im Vergleich zu den übrigen zu untersuchenden Texte sehr lang ist. Die gehäufte absolute Zahl an „gott“-Begriffen könnte sich also auch aus der umfangreichen Wortmenge erklären. Zugleich sieht man jedoch auch, dass die Rede im Sportpalast von 1940, in welcher ebenfalls 12 Mal das Wort „gott“ zu finden ist, eine im Vergleich mit den anderen Texten durchschnittliche Wortzahl besitzt. Hier taucht der Begriff also auch im Verhältnis zu übrigen Wortzahl sehr oft auf. Deutlich hervorheben kann man dies auch durch ein Liniendiagramm, indem man als Wert der y-Achse die relative Frequenz bestimmt.

Als weiteren Untersuchungsbegriff wählte ich das Wort „heil*“. Ähnlich wie bei „gott*“ zeigte sich auch hier eine Häufung in der langen Rede im Sportpalast von 1939. Auffallend ist hier, dass es in der Rundfunkansprache von 1945 noch mal einen Anstieg im Vergleich zu den Jahren davor gibt. Dies ist umso bemerkenswerter, da diese letzte Rede in unserer Auswahl zugleich die kürzeste ist. Dadurch ist die relative Häufigkeit bei diesem Text am größten. Dies könnte mit der drohenden Kriegsniederlage zusammenhängen. Durch eine Sakralisierung des Krieges soll dieser nicht nur gerechtfertigt, sondern auch als moralische Notwendigkeit herausgestellt werden. Eine genaue Durchsicht der Ansprache bestätigt diese Vermutung. So sei es wichtig „den heiligen Entschluß zu erhärten, die Waffen zu führen“, zumal Hitler „von der heiligen Überzeugung“ beseelt sei, dass der Allmächtige den Führer und das deutsche Volk schließlich zum Sieg führe.

Im Vergleich von „Raw Frequencies“ (absolute Häufigkeit, Diagramm oben) und „Relative Frequencies“ (relative Häufigkeit, Diagramm unten) des Begriffes „heil*“ zeigt sich, wie sehr die Ergebnisse einer Statistik von der Wahl der Parameter bzw. Maßzahlen abhängen.

 

Selbstreflektion und weitergehende Überlegungen

Insgesamt war die Textanalyse mit Voyant Tools sehr interessant und hat mir die Möglichkeiten einer solchen statistischen Auswertung vor Augen geführt. Die zahlreichen Grafiken und Diagramme haben die linguistischen Häufigkeitsauswertungen auf deutliche und attraktive Weise veranschaulicht. Sie eignen sich ideal, um quantitative Quelltextanalysen in Forschungsarbeiten und Präsentationen ansprechend darzustellen und die sprachlichen Ausführungen zu ergänzen. Zugleich kann eine solche statistische Auswertung auch für die interne Quellenarbeit genutzt werden. So erhält man einen ersten Eindruck von den zu untersuchenden Texten und eventuell Hinweise zu möglichen Interpretationsansätzen. Man sollte sich jedoch vor Augen führen, dass dieses „Distant Reading“ keine inhaltliche Auswertung ersetzt. Um eindeutige Schlussfolgerungen ziehen zu können, ist eine Überprüfung und Analyse der Texte notwendig.

Durch den relativ großen Umfang an Darstellungsformen konnte ich noch nicht alle Möglichkeiten austesten und verwenden. Diese Vielfalt erlaubt eine Visualisierung, die genau auf die individuellen Forschungszwecke ausgerichtet ist. Zugleich sollte man aber auch aufpassen, seine Forschungsergebnisse nicht mit zu vielen, letztendlich redundanten Grafiken zu überfrachten. Daher habe ich mich für einige wenige Darstellungsgrafiken entschieden, die die Ergebnisse übersichtlich präsentieren. Auch bei der Wahl der Begriffe musste ich zu Beginn abwägen. Nachdem ich mehrere Wörter ausgewählt und mit Voyant im Text gesucht hatte, habe ich mich schließlich für zwei Begriffe entschieden. Diese konnten in den vorliegenden Texten anschauliche Ergebnisse liefern. Ein weiteres Problem für mich stellte der relativ kleine Textkorpus dar. Dies war sicherlich dem einführenden Charakter dieser Übung geschuldet. Für eine aussagekräftigere Analyse der nationalsozialistischen Religionsrhetorik müssten umfangreiche Textsammlungen durch Voyant Tools analysiert werden.

In Voyant kann man sich die gesuchten Wörter auch als Blasen in einem Textstrang anzeigen lassen. Violett repräsentiert hier das Vorkommen des Begriffes „heil*“, während die türkisfarbenen Blasen die Häufigkeit des Wortes „gott*“ anzeigen.

Schreibe einen Kommentar