AntConc

Was ist AntConc?

AntConc ist ein Konkordanztool für geschriebene Korpora, mit dem man relativ einfach Standardsuchanfragen der computerbasierten Korpusanalyse durchführen kann. Die Software erstellt automatisch Wortlisten (Wortfrequenz) und Statistiken, etwa zum Verhältnis zwischen „token“ und „types“, mit denen sich u.a. der Wortschatzreichtum eines Textes untersuchen lässt. Das Tool unterstützt das gängige UTF-8-Format und erlaubt Suchanfragen mit regulären Ausdrücken. AntConc ist Teil einer Reihe vieler weiterer Tools rund um die Analyse von Texten (z.B. AntWordProfiler, AntGram, AntPConc oder FireAnt).

Vorteile:

  • einfache, intuitive Bedienung
  • übersichtliche Konkordanzlisten
  • Trefferansicht sortierbar
  • Cluster- und N-Gramm-Berechnungen möglich
  • Auswertungen mit POS-getaggten und annotierten Texten möglich
  • Kontrastive Analysen
  • für PC und Mac verfügbar
  • Video-Tutorials und Hilfen

Nachteile: 

  • manuelles Annotieren/Transkribieren nicht möglich
  • keine Text-Bild-Analysen
  • nur für Korpora bis ca. 1,5 Mio. Token

Getting started/Nutzungsszenario:

Häufig sind es beiläufige Beobachtungen im Alltag, die zu einer linguistisch interessanten Fragestellung hinführen. Das können auffällige Formulierungen sein, Mode- und Tabuwörter, aber auch sprachliche Zweifelsfälle. Am Beispiel der relativ neuen Nahrungsmittelkategorie Superfood aus dem gegenwärtigen Ernährungsdiskurs werden im Folgenden die Möglichkeiten der korpuslinguistischen Analyse unter Einsatz von AntConc aufgezeigt.

Ausgangspunkt ist die Beobachtung, dass der Anglizismus Superfood immer häufiger in der öffentlichen Pressekommunikation auftritt und gleichzeitig von der Lebensmittelindustrie zur Produktwerbung eingesetzt wird. Er klingt allein durch das Determinans super euphemistisch. Das Hochwertwort beschreibt auf einen Schlag, dass es sich bei einem Nahrungsmittel um ein irgendwie innovatives Produkt handelt. Aber welche Bedeutungsaspekte lassen sich für das Schlüsselwort im Einzelnen nachweisen? Um dieser Frage nachzugehen, lohnt es sich, ein kleines Korpus zusammenstellen. Es könnte z.B. einige Texte enthalten, die in den letzten zwölf Monaten zu diesem Thema in verschiedenen Zeitungen, Zeitschriften oder Magazinen erschienen sind. Praktikabler ist es hier, Online-Artikel auszuwählen. Über den UB-Katalog erhält man einen lizenzierten Zugang zu weiteren Zeitungen (z.B. Frankfurter Rundschau). Die Texte werden in ein Word-Dokument kopiert und müssen für die Auswertung in AntConc im txt-Format gespeichert werden (z.B. mit UTF 8-Codierung). Anschließend ist der Text hinsichtlich gängiger Fehlübertragungen (harte Trennstriche, überflüssige Menüleisten) zu bereinigen, damit anschließend nicht nur einzelne Wörter, sondern auch Wortgruppen gefunden werden. Liegen alle txt-Dokumente vor, können diese in AntConc entweder über „Open File(s) as ’Quick Corpus’“ geöffnet und anschließend im „Corpus Manager“ als Korpus gespeichert werden, alternativ können die Texte auch direkt im „Corpus Manager“ hinzugefügt werden. Dazu den Corpus Manager öffnen und dort „Raw File(s)“ auswählen, es können entweder einzelne Dateien über „Add File(s)“ hinzugefügt werden, oder ganze Verzeichnisse über „Add Directory“. Dem Korpus dann einen „Corpus name“ geben, danach mit „Create“ das Korpus erstellen und dieses über „Save (to file)“ speichern („Target Corpus“).

Screenshot 1: Corpus Manager

Auswertung:

Gibt man in die Suchzeile das Wort superfood ein, erhält man zunächst alle Treffer in der KWIC-Ansicht. Groß- und Kleinschreibung wird nur berücksichtigt, wenn das Häkchen bei „Case“ gesetzt ist. Um einen ersten Eindruck vom sprachlichen Kotext zu gewinnen, kann man die Treffer über die „Sort Options“ zusätzlich sortieren (Screenshot 2). Fehlt das Häkchen bei „Words“, berücksichtigt die Suchanfrage keine Wortgrenzen, weshalb sowohl die Pluralform als auch verschiedene Komposita wie Superfoodpulver gelistet werden. Es deuten sich nun in der KWIC-Übersicht an verschiedenen Stellen diskursive Auseinandersetzungen mit dem Begriff Superfood (14) und dem Trend der Superfoods (19) an. Ebenfalls scheinen verschiedene Nahrungsmittel wie Brokkoli (15) oder Gojibeeren (10) mit dem Schlüsselwort assoziiert zu sein.

Screenshot 2: Zentrierte Konkordanzen zum Suchausdruck „superfood“

Die Attribute echtes und exotische deuten ebenfalls auf diese beiden Bereiche hin: erstens die diskursiv verhandelte Frage, was Superfoods prinzipiell bewirken und zweitens welche Lebensmittel darunterfallen. Für eine systematische Auflistung der Adjektivattribute muss zunächst ein nach Wortarten getaggtes Korpus erstellt werden. Dies ermöglicht das Tool AntTag auf einfache Weise. Bei der Umwandlung müssen die Spracheinstellung „German“ und die Taggingvariante „horizontal“ (nicht „vertikal“) gewählt werden. Das getaggte Dokument wird automatisch unterhalb des ursprünglichen txt-Dokuments gespeichert, es kann auch ein gesamter Ordner getaggt werden, dieser wird ebenfalls automatisch am bisherigen Speicherort abgelegt. Lädt man nun alle auf diese Weise erzeugten POS-getaggten Dateien in AntConc ein, erhält man über die Suchanfrage „ADJA superfood“ eine Übersicht über alle Adjektivattribute, die unmittelbar linksseitig an das Schlüsselwort anschließen (Screenshot 3). Diskurslinguistisch auffällig sind Hinweise auf einen umkämpften Themenbereich, bei dem öffentlich diskutiert wird, was echte oder auch was wahre Superfoods sind. Auch wird die diskursive Aufwertung selbst thematisiert z.B. über Belege von den gehypten, neuen und hippen Superfoods. Das Modewort bezeichnet offenbar diverse Produkte innerhalb einer aktuellen Ernährungsmode.

Screenshot 3: Zentrierte Konkordanzen zum Suchausdruck „superfood“ mit POS-getaggtem Korpus

Relativ leicht lässt sich unter dem Reiter „Word“ eine Übersicht zu den Worthäufigkeiten erstellen (Screenshot 4). Dort sind die ersten Inhaltswörter die Singularform superfood (36), die Wortformen essen (32) sowie gesund (45). Auf den oberen Rängen befinden sich, wie zu erwarten, eine Reihe hochfrequenter kleinerer Wörter von den Determinativen bis zu den Hilfsverben, weit oben befinden sich die Präpositionen in und mit.

Screenshot 4: Wörterliste

Eine weitere Auswertungsperspektive einer Corpus-Driven-Methodik bietet die Berechnung von N-Grammen, die sowohl mit dem getaggten als auch mit dem ungetaggten Korpus durchführbar ist. Möchte man eine Übersicht der häufigen Verbindungen ohne Suchbegriff durchführen, geschieht dies im Bereich „N-Gram“. Die Übersicht zu den Bigrammen (Screenshot 5) gibt einen Hinweis auf den Schlüsselanglizismus clean eating, und auch die usuelle Wortverbindung gibt es zeigt, dass die Texte tendenziell darauf zugeschnitten sind zu definieren, welche Arten von Superfood wo und wie verzehrt werden (Screenshot 6). Verfolgt man den Pfad der durch mit eingeleiteten Phrasen weiter, kann man dies über „N-Gram“ oder „Cluster“ untersuchen. Da hier ein Suchbegriff verwendet wird, sind beide Untersuchungen möglich und unterscheiden sich nur dadurch, dass unter „Cluster“ eine Auswahl möglich ist, an welcher Position der Suchbegriff stehen soll. Es lässt sich hier (Screenshot 6) möglicherweise eine diskursspezifische präpositionale Einbettung feststellen, bei der über das jeweilige Nomen zum Ausdruck kommt, was alles als Superfood gilt:

NN mit Honig/ Chiasamen/ Grünkohl

Algen/ Pudding mit NN.

Superfoods stellen semantisch gesehen Anreicherungen dar. Dieses ernährungsphysiologische Surplus wird morphologisch durch Komposita (Chia-Pudding) und syntaktisch u.a. in einer mit-Konstruktion realisiert. Diese Konstruktionen dienen dazu, bekannte Gerichte und Lebensmittel – aus Gesundheitsgründen – mit gesunden Nahrungsmitteln zu kombinieren (Salat mit Grünkohl, Smoothie-Bowls mit Chiasamen).

Screenshot 5: Bigramme
Screenshot 6: Belege für die Wortverbindung „gibt es“ in der KWIC-Ansicht
Screenshot 7: Übersicht zu den Clustern zur Präposition „mit“
Screenshot 8: Kookkurrenzen zum Suchwort „Superfood“ (Collocates) in Fünf-Wort-Umgebung links und rechts

Für die Auswertung nach „Collocates“ muss ein Ausgangswort bzw. eine Phrase gewählt werden, mit denen andere Wörter in einer vorab gewählten Umgebung kookkurrieren (voreingestellt ist eine Umgebung fünf Wörter links und rechts vom Suchterm). Für Superfood ergibt sich eine Häufung der Singular- und Plural-Formen von sein (ist und sind) (Screenshot 8), was die Vermutung nahelegt, dass der Anglizismus regelmäßig in Prädikationen eintritt, in denen definitorische Zuschreibungen erfolgen, wie in den folgenden Prädikativkonstruktionen:

Belege für die heilenden Kräfte von Superfood sind rar. (Focus online 12.09.2018)

Dabei ist Hafer ein wahres „Superfood“. (Spiegel online 19.4.2018)

Eine Keyword List kann nur dann erstellt werden, wenn vorab im „Corpus Manager“ ein „Reference Corpus“ in AntConc erstellt wurde. Für das Superfood-Korpus würde sich z.B. ein thematischer Kontrast zu globaleren Ernährungsartikeln anbieten, die vermutlich weniger metadiskursive Spuren aufweisen, da die Definitionen weniger strittig sind. Anzunehmen ist darüber hinaus, dass in geringerem Maße Konstruktionen des Definierens und Zuordnens auftreten.

Fazit:

Diese korpuslinguistische Mini-Studie hat die Bezeichnung Superfood als Modewort ausgewiesen, dessen Gesundheitseffekt mit einzelnen Lebensmitteln und Inhaltsstoffen korrespondiert und dessen Gesundheitswirkung im öffentlichen Pressediskurs (kritisch) diskutiert wird.

Weiterführende Links:

http://www.laurenceanthony.net/software/antconc/