Öffentliche Korpora

Im Folgenden finden Sie eine Zusammenstellung öffentlich zugänglicher Textkorpora (teilweise ist eine Registrierung erforderlich), die Sie für die eigene empirische Forschung nutzen können. Die Korpora sind in der Regel nach linguistischen Kriterien annotiert und eignen sich daher sehr gut für detaillierte Suchanfragen zu linguistischen Phänomenen. Die Liste basiert größtenteils auf Korpora, mit denen auch in der Paderborner Linguistik gearbeitet wird. Es wird daher kein Anspruch auf Vollständigkeit erhoben.

DeReKo: Deutsches Referenzkorpus

Das Deutsche Referenzkorpus ist die weltweit größte Sammlung elektronisch verfügbarer, deutschsprachiger Texte. Weitere Informationen zum Korpusaufbau finden Sie hier.

Korpora am Archiv für gesprochenes Deutsch

Das Institut für Deutsche Sprache bietet externen Benutzerinnen und Benutzern den Zugriff auf 40 Korpora des gesprochenen Deutsch. Zu den Subkorpora gehören Gesprächskorpora, Interviewkorpora und Korpora zur Erforschung von Sprachvarietäten. Informationen zur Bedienung und zum Gebrauch auf die Datenbank für Gesprochenes Deutsch (DGD2) sind hier zu finden.

TüBa-D/Z

Die Tübinger Baumbank des Deutschen / Zeitungskorpus (TüBa-D/Z) ist ein Korpus mit über 3800 Zeitunsartikel der „tageszeitung“. Da es manuell annotiert wurde, lässt es sich auf vielen unterschiedlichen Annotationsebenen durchsuchen, darunter nach morphologischen, syntaktischen, lexikalischen und sogar textuellen Kriterien (Konnektoren).

Referenzkorpus Altdeutsch

Das Referenzkorpus Altdeutsch ist mittels des Korpustools ANNIS ohne Anmeldung kostenlos und browserbasiert zugänglich und nutzbar. Das Korpus Deutsch Diachron Digital enthält Korpustexte aus verschiedenen Sprachepochen des Deutschen, darunter dem Althochdeutschen (bis 1050), dem Mittelhochdeutschen (1050-1350) und dem Frühneuhochdeutschen (1350-1650).

DTA: Deutsches Textarchiv

Das „Deutsche Textarchiv“ stellt ein Referenzkorpus deutschsprachiger Texte aus dem Zeitraum zwischen 1600 und 1900 zur Verfügung. Es eignet sich besonders gut zur Untersuchung ganz unterschiedlicher Sprachwandelprozesse und bietet viele nützliche Funktionen zur statistischen Auswertung.

DWDS: Digitales Wörterbuch der deutschen Sprache

Das DWDS bietet neben einem Wortauskunftssystem zur deutschen Sprache eine große Sammlung verschiedener elektronischer Textkorpora, die nach linguistischen Erfassungskriterien annotiert und zur öffentlichen Nutzung bereitgestellt werden. Eine Übersicht über die Teilkorpora finden Sie hier.

Fußballlinguistik

Mit den öffentlichen Korpora zur Fußballlinguistik wird eine thematisch spezifische Textsammlung aus dem Forschungsbereich der Sportlinguistik verfügbar gemacht. Eine Korpusübersicht finden Sie hier.

brand-history.com

Diese Seite ist eine Fundgrube für historische und neuzeitliche Werbeanzeigen und -plakate. Die Quellen eignen sich besonders gut zur multimodalen Analyse von Anzeigentextsorten, auch unter der Perspektive des Sprachwandels. Achtung: Bei der Weiternutzung gilt das Urheberrecht!