Sabrina Wiescholek

Verhältnis von Theorie und Empirie

Aufgrund von systematischer Beobachtung mit Hilfe verschiedenster Erhebungs– und Auswertungsverfahren sammeln empirisch arbeitende Wissenschaftler/-innen Daten. Nach der Auswertung dieser Daten können Schlussfolgerungen gezogen werden. Genau diese Schlussfolgerungen führen zur Einwicklung von Theorien (induktives Vorgehen). So entstandene Theorien müssen jedoch weiterhin überprüft werden: Ist die Theorie überhaupt plausibel? Kann die Theorie auf andere Themengebiete übertragen werden? Hält die aufgestellte Theorie weiteren Beobachtungen stand, bewährt sie sich also? Dies alles sind Fragen, mit denen sich wiederum die empirische Wissenschaft beschäftigt. Durch Prüfung präzise formulierter Forschungsfragen bzw. der daraus abgeleiteten Hypothesen wird die Theorie verworfen, weiterentwickelt und wenn nötig verändert (deduktives Vorgehen).

Abb.: Wechselspiel von Theorie und Empirie aus: Imhof (2010), S. 18

Theorie und Empirie stehen in einem ständigen Wechselverhältnis zueinander. Stellen Sie sich zur Veranschaulichung dieses Wechselverhältnisses von Theorie und Empirie folgendes Beispiel vor, eine typische Situation im Klassenraum der 6a: Sie beobachten als angehender Lehrer/angehende Lehrerin während Ihres Praktikums jeden Tag, dass die Schülerinnen und Schüler in der sechsten Schulstunde besonders laut und unaufmerksam sind. Sie können sich kaum konzentrieren und Aufgaben werden meist nicht richtig zu Ende geführt. Des Weiteren beobachten Sie, dass sich die Schülerinnen und Schüler an einem Tag der Woche, am Donnerstag, anders verhalten. In der sechsten Stunde des Donnerstages ist das Verhalten der Schülerinnen und Schüler relativ unauffällig. Im Unterricht herrscht eine rege Beteiligung und die Lehrerin in der Stunde gibt den SuS nie Hausaufgaben auf, weil Sie alles innerhalb dieser sechsten Stunde bereits erledigen. Nach einem Gespräch mit der Klassenlehrerin erfahren Sie, dass die Schülerinnen und Schüler der 6a immer am Donnerstag in der fünften Stunde Sport haben. Sie entwickeln nun auf Grund Ihrer Beobachtungen die Theorie, dass die sportliche Betätigung der SuS zu einer erhöhten Konzentration führt, kurz: Sport führt zu mehr Konzentration und besserer Arbeitsleistung. Diese Theorie ist jedoch noch ziemlich wackelig, denn sie stützt sich allenfalls auf ihre vereinzelten Beobachtungen.

Zu vielen verschiedenen Themen bzw. Theorien existiert bereits Forschung und Literatur. Nicht nur aus Beobachtungen, sondern auch aus Literatur zu einem bestimmten Thema kann eine Theorie entwickelt werden. So können nicht nur durch Beobachtungen Fragestellungen entstehen, sondern auch auf Grund der Auseinandersetzung mit Literatur. Aus der Theorie werden Forschungsfragen entwickelt und Hypothesen abgeleitet, die es zu überprüfen gilt. Bestätigen sich die Hypothesen, ist die Theorie vorerst bewährt. Bestätigen sich die Hypothesen nicht, muss die Theorie entweder weiterentwickelt, verändert oder sogar vollständig verworfen werden.

Fragestellung:

Warum ist eine präzise Fragestellung so wichtig für die empirische Forschung? Die Fragestellung begleitet den/die Wissenschaftler/-in durch den gesamten Forschungsprozess. Anhand der Fragestellung entscheidet sich, welche Hypothesen zu prüfen sind, welche Erhebungs- und Auswertungsmethoden qualitativer oder quantitativer Art zur Prüfung der Hypothesen in Frage kommen und innerhalb welchem Forschungskontexts und Umfangs die Ergebnisse interpretiert werden können.

Im obigen Beispiel wird das Verhalten von SuS im Klassenraum diskutiert. Wichtig für eine empirische Studie ist eine möglichst konkrete Fragestellung. Was unterscheidet nun eine Fragestellung von einem Thema? Wann ist eine Fragestellung präzise formuliert, so dass Sie den Forschungsprozess konstruktiv leiten und begleiten kann? Am obigen Beispiel und weiteren anderen Beispielen wird im Folgenden veranschaulicht, wie sich das Thema und die Fragestellung unterscheiden, genauer gesagt, wie eine präzise Fragestellung aus einem Thema abgeleitet werden kann. Das in Kapitel 1.1 beschriebene Beispiel der Klasse 6a kann grob dem Thema „Konzentration im Unterricht“ zugeordnet werden. Hinsichtlich dieses Themas kann jedoch sehr viel Verschiedenes gefragt werden. Zum Beispiel: Wie macht sich die Konzentration von SuS bemerkbar? Was ist Konzentration? Wie kann Konzentration im Unterricht gefördert werden? All diese Fragen betreffen das Thema „Konzentration im Unterricht“, beziehen sich jedoch nicht auf die Beobachtung unseres Beispiels. Die konkrete Forschungsfrage passend zu den Beobachtungen in der 6a würde folgendermaßen lauten: „Welchen Einfluss hat der Sportunterricht auf die Konzentrationsfähigkeit von SuS der sechsten Klassen?“

Nachfolgend sollen einige Themen und passende Fragestellungen exemplarisch den Unterschied von Thema und Fragestellung veranschaulichen:

Thema	Forschungsfrage
Lesemotivation von SuS	Wie kann Lesemotivation von SuS in der Hauptschule gefördert werden? Wie lassen sich Geschlechterunterschiede in der Lesemotivation von Jugendlichen erklären? Welchen Einfluss hat das Leseselbstkonzept auf die Lesemotivation von Grundschülern/Grundschülerinnen der vierten Klasse?
Unterrichtsstörungen	Welche theoretischen Ansätze zum Thema Unterrichtsstörungen gibt es? Welchen Einfluss hat ein systematisch organisierter Unterricht auf die Häufigkeit von Unterrichtsstörungen?
Klassenklima	Wie kann das Klassenklima positiv beeinflusst werden? Welchen Einfluss hat das Klassenklima auf das Wohlbefinden des/der einzelnen Schülers/Schülerin? Weisen Klassen mit positivem Klassenklima eine bessere Schulleistung auf als Klassen mit schlechtem Klima?

Die Formulierung einer stichhaltigen Fragestellung gehört zu den allgemeinen Vorbereitungen einer empirischen Untersuchung. Es ist wichtig, dass schon bei der Formulierung der Fragestellung darauf geachtet wird, möglichst auf umgangssprachliche Formulierungen zu verzichten. Im Rahmen dieses Schrittes ist des Weiteren, wie oben schon erwähnt, zu prüfen, ob bereits Theorie zu der eigenen Fragestellung existiert. Welche Hypothesen wurden bereits geprüft? Welche Forschungsergebnisse existieren bereits?

Stellenwert von Hypothesen im Forschungsprozess

Die vermuteten Antworten auf eine Fragestellung werden als Hypothesen bezeichnet. Hypothesen können geprüft werden, wenn sie falsifizierbar, also widerlegbar sind. Ein Beispiel für eine schwer zu widerlegende Hypothese ist die Behauptung: „Es gibt blaue Bäume.“ Auf der einen Seite ist die Hypothese bestätigt, wenn ein blauer Baum gefunden werden würde. Dies kann sich allerdings als ein sehr langwieriges Vorhaben herausstellen. Auf der anderen Seite, müssten, um die Hypothese zu falsifizieren, alle auf der Erde existierenden Bäume betrachtet werden. Aber auch danach wäre es schwer festzustellen, ob nicht doch irgendwo ein blauer Baum existiert. Bei der Aussage „Es gibt blaue Bäume“ handelt es sich um eine Existenzaussage. Die Schwierigkeit bei einer solchen Aussage liegt darin, sie zu widerlegen. Dieses Beispiel veranschaulicht die Notwendigkeit, dass wissenschaftliche Hypothesen potentiell falsifizierbar, also durch systematische Beobachtungen generell überprüfbar sein müssen.

Bei Hypothesen kann zwischen Unterschieds-, Zusammenhangs- und Veränderungshypothesen unterschieden werden. Unterschiedshypothesen postulieren einen Unterschied, bspw. zwischen zwei Gruppen. (Beispiel: Ziffernzeugnisse werden von SuS besser verstanden als verbale Beurteilungen). Zusammenhangshypothesen beziehen sich auf den Zusammenhang zwischen zwei Merkmalen (Beispiel: Die Motivation der SuS hängt positiv mit den Leistungen im abschließenden Test zusammen). Veränderungshypothesen beschreiben demgegenüber Veränderungen über die Zeit (Beispiel: Die Leistungen der SuS steigen vom Anfang bis zum Ende des Schuljahres).

Variablen

Unsere Hypothesen beinhalten verschiedene Variablen. Was sind nun aber Variablen? Es wird unterschieden zwischen manifesten und latenten Variablen. Manifeste Variablen sind Aspekte bzw. Untersuchungsgegenstände, welche direkt beobachtet werden können. Zum Beispiel kann bei den Bundesjugendspielen die Schnelligkeit im 100-Meter-Lauf direkt mit Hilfe einer Stoppuhr gemessen werden. Latente Variablen sind im Gegensatz zu manifesten nicht unmittelbar beobachtbar. Beispielsweise muss zuerst operationalisiert werden, was mit „körperlicher Fitness“ gemeint ist. Es müssen demnach Aspekte gefunden werden, die auf eine körperliche Fitness schließen lassen. Dies kann zum Bespiel die Schnelligkeit im 100-Meter-Lauf sein, aber auch die Ausdauer, die Beweglichkeit, die Muskelmasse u.v.m. Eine weitere Unterscheidung kann hinsichtlich der Funktion von Variablen getroffen werden. Variablen lassen sich in dem Fall in unabhängige (uV) und abhängige Variablen (aV) unterschieden. Diese Differenzierung drückt ihre Beziehung innerhalb einer Hypothese aus. Wir werden im Kapitel 1.6, in welchem verschiedene Untersuchungsdesigns vorgestellt werden, näher auf die Beziehung zwischen abhängigen und unabhängigen Variablen eingehen.

Eine weitere Unterscheidung hinsichtlich der Funktion von Variablen ist die Einteilung in unabhängige und abhängige Variablen. Wir werden im Kapitel über die Untersuchungsdesigns weiter darauf eingehen.

Probleme der Operationalisierung

Für die Spezifizierung Ihrer Untersuchung ist es unerlässlich, diejenigen Aspekte bzw. Variablen, welche Sie untersuchen wollen, zu definieren. Das richtige Fachwort hierfür ist „Operationalisierung“. Mit der Operationalisierung stellt sich die Frage nach dem, was überhaupt gemessen werden soll. Bei der oben gestellten Forschungsfrage nach dem Einfluss des Klassenklimas auf die Leistung der SuS ist es notwendig, mehrere Aspekte genau zu operationalisieren. Auf der einen Seite muss die Frage beantwortet werden, was unter dem Begriff Klassenklima verstanden und ab wann dieses als positiv bezeichnet werden kann. Es steht die Entscheidung aus, wie das Klassenklima in der Untersuchung erhoben werden soll? Wer, wie und was genau soll befragt werden? Auf der anderen Seite muss genau festgelegt werden, was mit Schulleistung gemeint ist. Schulleistung kann auf Grundlage von Noten, Leistungs- oder Intelligenztests ermittelt werden. Die Schulleistung eines einzelnen Schülers, aber auch der ganzen Klasse kann für die Untersuchung relevant sein. In der möglichst genauen Operationalisierung von Variablen bestimmt sich häufig die Güte einer Untersuchung.

Als Exkurs soll an dieser Stelle kurz auf die Qualität bzw. die Güte empirischer Forschung eingegangen werden, welche sich anhand verschiedener Kriterien beurteilen lässt. Es werden in der Regel drei Gütekriterien voneinander unterschieden: die Objektivität, die Reliabilität und die Validität. Die Objektivität betrifft die Unabhängigkeit der Untersuchung von dem Testleiter. Sie ist im gesamten Forschungsprozess (Durchführung, Auswertung und Interpretation der Untersuchung) relevant. Die Betrachtung von Reliabilität beschäftigt sich mit der Frage der Genauigkeit einer Messung. Eine Messung ist reliabel, wenn ein Merkmal exakt, also ohne Messfehler, gemessen wird. Wird zum Beispiel die Rechenleistung eines Schülers zu zwei verschiedenen Messzeitpunkten mit gleichen Testverfahren gemessen und wird davon ausgegangen, dass zwischen den beiden Messzeitpunkten keine Veränderung stattgefunden hat, muss ein reliabler Test dasselbe Testergebnis hervorbringen. Der Schüler müsste also zu beiden Messzeitpunkten dieselbe Rechenleistung aufweisen. Um die Reliabilität zu bestimmen, gibt es bestimmte Testverfahren, wie die Retest-Reliabilität, die Paralleltest-Reliabilität, die Interrater-Reliabilität (besonders für qualitative Forschung), die Testhalbierungs-Reliabilität oder die interne Konsistenz. An dieser Stelle soll jedoch nicht weiter darauf eingegangen werden. Die Validität beschäftigt sich im Gegensatz zur Reliabilität mit der Frage, ob tatsächlich das gemessen wird, was gemessen werden soll. Dabei kann zwischen interner und externer Validität unterschieden werden. Diese Formen von Validität nehmen einen übergeordneten Blick auf die gesamte Planung einer Untersuchung ein. Die interne Validität betrifft die Untersuchung selbst. Sind die Beobachtungen und Befunde innerhalb einer Studie tatsächlich darauf zurückzuführen, was gemessen wurde und was als ursächliche Variable angenommen wurde? Hingegen dazu geht es bei der externen Validität um die Generalisierbarkeit der Ergebnisse. Können die Ergebnisse einer Untersuchung über die Stichprobe hinweg verallgemeinert werden?

Versuchsdesigns/Versuchsplan/Versuchsanordnung

Ist eine Fragestellung konkret formuliert und sind daraus Hypothesen abgeleitet, müssen wir uns nun damit beschäftigen, wie und welche Daten passend zu unserer Fragestellung erhoben werden. Beller (2008) formuliert für diesen Schritt folgende Frage: „ Wie ist die Untersuchung zu gestalten, damit die Fragestellung überhaupt sinnvoll beantwortet werden kann?“

Je nachdem, welche Hypothesen geprüft werden sollen, bieten sich unterschiedliche Untersuchungsdesigns an. Dies hängt eng damit zusammen, um welche Art von Hypothese es sich handelt. Oben wurden drei Arten von Hypothesen vorgestellt: Unterschieds-, Zusammenhangs-, und Veränderungshypothesen.

Zum Betrachten von Zusammenhangshypothesen, also z. B. der Hypothese: „Je höher ausgeprägt das lesebezogene Selbstkonzept des Schülers/der Schülerin ist, desto höher ist auch seine/ihre Lesemotivation“, eignen sich am besten korrelative Studien. Hier werden verschiedene Variablen, in unserem Fall, das lesebezogene Selbstkonzept und die Lesemotivation betrachtet, erhoben und deren statistischer Zusammenhang berechnet. Hier gehen wir noch genauer auf die Auswertung hinsichtlich der Zusammenhangsmaße ein. An dieser Stelle sei nur schon einmal auf die Limitation von korrelativen Studien hingewiesen. Korrelationen veranschaulichen ausschließlich den statistischen Zusammenhang zwischen zwei Variablen, es kann keine Wirkrichtung, also Kausalbeziehung ausgedrückt werden. Was hier verglichen wird, sind immer mehrere unabhängige Variablen (uVs).

Einen Vorteil hinsichtlich der Aussagen zur Kausalität bietet das Experiment. Verglichen wird dabei der Einfluss von unabhängigen Variablen (aV) auf eine oder mehrere abhängige Variablen (uV). Dabei wird meist eine unabhängige Variable verändert, um den Einfluss dieser auf die abhängige Variable zu prüfen. Betrachten wir in diesem Fall die Hypothese, dass die Lesehäufigkeit die Leseleistung positiv beeinflusst. Die abhängige Variable ist hier die Leseleistung, die unabhängige die Lesehäufigkeit. Mit Hilfe eines Experimentes können wir diese Hypothese folgendermaßen prüfen: Wir wählen verschiedene sechste Klassen aus mehreren Realschulen aus. Diese Klassen erhalten in ihrem Unterricht extra Lesezeit zur Verfügung (Experimentalgruppe). Alle anderen Klassen der beteiligten Realschulen erhalten keine extra Lesezeit (Kontrollgruppe). Die Leseleistung wird nun in Kontroll- und Experimentalgruppe sowohl vor Einführung der zusätzlichen Lesezeit gemessen als auch ca. ein halbes Jahr danach. Die aufgestellte Hypothese lässt sich bestätigen, wenn die Experimentalgruppe zum zweiten Messzeitpunkt eine bessere Leseleistung aufzeigt, als die Kontrollgruppe. In einem solchen Schulsetting besteht die Möglichkeit, dass andere Variablen, wie z.B. der Deutschunterricht der Lehrkraft, die Konzentrationsfähigkeit bzw. Intelligenz der SuS als so genannte Störvariablen das Untersuchungsergebnis indirekt bedingen. In Experimenten, bei denen in einer natürlichen Umgebung etwas verändert wird, z.B. in der Schule, im Kindergarten oder in anderen Institutionen, wird somit von einem Feldexperiment oder einem quasiexperimentellen Design gesprochen. Es sollte versucht werden, Unterschieden, welche sich auf Grund der Gruppeneinteilung ergeben, durch Randomisierung, also einer zufälligen Zuteilung der Testpersonen zu Experimental- und Kontrollgruppe, gerecht zu werden.

Das eben beschriebene Untersuchungsdesign lässt sich als Prä-, Post-, Kontrollgruppendesign bezeichnen. Es eignet sich, wie das Beispiel der Lesehäufigkeit veranschaulicht, sehr gut, um die Wirksamkeit von bestimmten Fördermaßnahmen, Unterrichtsmethoden usw. zu überprüfen.

Betrachten Wir nun Untersuchungsdesigns, die herangezogen werden, um Veränderungen zu messen. Mit Hilfe eines Querschnittsdesigns werden unterschiedliche Gruppen bzw. Kohorten zu einem bestimmten Messzeitpunkt untersucht. Kohorten können beispielsweise Jahrgänge, Altersgruppen, Berufsgruppen u.a. sein. So arbeitet z.B. die große Schulleistungsvergleichsstudie PISA mit einem Querschnittsdesign. Zum selben Messzeitpunkt wird in allen OECD-Ländern derselbe bzw. den bestimmten Ländern angepasste Schulleistungstest bei 15-jährigen SuS durchgeführt. Die Leistungsergebnisse der SuS in den einzelnen Ländern können dann miteinander verglichen werden. Was ein Querschnittsdesign nicht leisten kann, ist der Vergleich auf individueller Ebene über einen bestimmten Zeitraum hinweg. Das heißt z.B. die Veränderung individueller Schulleistung über die gesamte Schulzeit.

Soll dies das Ziel einer empirischen Studie sein, bietet sich als Untersuchungsdesign der Längsschnitt an. Hier werden über mehrere Messzeitpunkte hinweg dieselben Personen (dieselbe Stichprobe) immer wieder untersucht. Zur Veranschaulichung kann die Forschungsfrage „Wie entwickelt sich die Lesemotivation im Laufe der Schulzeit?“ herangezogen werden. Daraus kann die Hypothese abgeleitet werden, dass die Lesemotivation im Laufe der Schulzeit immer geringer wird. Folglich werden mehrere Messzeitpunkte benötigt, um diese Hypothese zu prüfen: Die erste Messung müsste zu Beginn der Schulzeit stattfinden; weiterführend könnte in der Mitte und am Ende der Grundschulzeit gemessen werden. Im Idealfall würden die an der Messung beteiligten SuS auch in der weiterführenden Schule an mehreren Erhebungen (5., 7., 10., 12. Schuljahr) teilnehmen. So kann ein Überblick über die gesamte Schullaufbahn gegeben werden. Allein für diese beim ersten Anblick sehr simpel erscheinende Forschungsfrage ergeben sich 7 Messzeitpunkte, die SuS würden über zwölf Jahre begleitet werden. Es wird deutlich, welche Schwierigkeiten mit einer Längsschnittuntersuchung verbunden sind:

Längsschnittuntersuchungen können mitunter sehr aufwendig bzw. zeitaufwendig sein.
Wenn Leistungstests in Längsschnittuntersuchungen eingesetzt werden, kann es zu einem Übungseffekt kommen: Bearbeiten SuS immer wieder in kurzen Abständen dieselben Aufgaben, merken sie sich die Lösungen.
Je länger der Zeitraum der Untersuchung, umso größer ist die Wahrscheinlichkeit eines Drop-Offs (Ausfall von Versuchspersonen; Selektivität). Der größte Drop-Off bei Unserem Beispiel wäre im Übergang von der Grundschule zur Weiterführenden Schule zu befürchten, da die SuS an viele verschiedene weiterführende Schulen wechseln. Aufgrund von Anonymisierung (siehe Kapitel zu Forschung und Ethik) ist schwer nachzuvollziehen, welche SuS an welche Schulen wechseln.

Wird Quer- und Längsschnittdesign kombiniert, kann von einem Kohorten-Sequenz-Design gesprochen werden. Dies ist die sowohl die zeitaufwendigste als auch die kostenintensivste Form der Untersuchungsdesigns. Es werden hier mehrere Kohorten, also z.B. Grundschüler/-innen der 3. und 4. Klasse sowie SuS der weiterführenden Schulen in der 5., 7. und 10. Klassen zu mehreren Messzeitpunkten untersucht. Eine gute Beispielstudie für das Kohorten-Sequenz-Design ist das Nationale Bildungspanel (NEPS) der Universität Bamberg.

Zum Abschluss des Kapitels soll an zwei Fragestellungen in der folgenden Tabelle der Weg von der Fragestellung über die Hypothese zum Untersuchungsdesign noch einmal veranschaulicht werden.

Beispiele der Untersuchungsplanung:

Fragestellung	Lernen SuS besser mit Graphiken und Bildern oder aus Texten?	Wie hängt das Bildungsniveau der Eltern mit der Leseleistung von SuS zusammen?
Hypothese	SuS lernen mit Hilfe von Graphiken und Bildern besser als aus Texten.(Unterschiedshypothese)	Je höher das Bildungsniveau der Eltern ist, umso besser können SuS lesen.(Zusammenhangshypothese)
Variablen	Lernleistungen (aV), Texte (uV), Bilder und Graphiken (uV)	Bildungsniveau der Eltern (uV), Leseleistung der SuS (uV)
Untersuchungs- design	Prä-Post-Kontrollgruppen-Design, Feldexperiment	Korrelative Studie

Literatur

Beller, S. (2008). Empirisch forschen lernen. Konzepte, Methoden, Fallbeispiele, Tipps. 2. überarb. Aufl. Bern: Huber.

Imhof, M. (2010). Psychologie für Lehramtsstudierende (2. Aufl.). Wiesbaden: VS Verlag für Sozialwissenschaften.

Moosbrugger, H. & Keleva, A. (2012). Testtheorie und Fragebogenkonstruktion. Berlin: Springer.

Forschen im Praxissemester

Überblick, Methoden, Beispiele

Planung von Studien

Verhältnis von Theorie und Empirie

Versuchsdesigns/Versuchsplan/Versuchsanordnung

Fragestellung

Hypothese

Variablen

Untersuchungs-

design