Fragebögen

Carla Bohndick

Schriftliche Befragungen werden meist mit Hilfe von Fragebögen durchgeführt. Unter einem Fragebogen kann eine sinnvolle Sammlung von Fragen, entweder auf Papier oder auch digital verstanden werden, die von den Untersuchungsteilnehmenden selbstständig und schriftlich beantwortet werden. Ein Vorteil ist, dass Fragebogenuntersuchungen sowohl in Ihrem Beisein, als auch auf postalischem Wege oder online durchgeführt werden können. Je nach Zweck können die Antwortmöglichkeiten in Fragebögen unterschiedlich stark standardisiert sein. Typischerweise geht mit einer stärkeren Standardisierung eine schnellere und einfachere Auswertung einher. Schwach standardisierte Befragungen sind dementgegen für gewöhnlich in neuen und schlecht strukturierten Forschungsfeldern angezeigt, in denen der explorative Charakter der Untersuchung im Vordergrund steht (s. Kapitel Standardisierung).

Ein Fragebogen besteht meist aus mehreren Teilen: In einer Einführung wird zunächst der Zweck der Untersuchung dargestellt. Darauf folgen häufig allgemeine Fragen zur Person, z. B. zum Geschlecht und Alter (soziodemographische Angaben) und schließlich werden die für die Forschungsfrage relevanten Themenbereiche behandelt. Am Schluss des Fragebogens können auch Fragen zur Nachbereitung, z. B. Evaluationsfragen zur Befragung selbst gestellt werden.

In einem Fragebogen können unterschiedliche Antwortmodalitäten eingesetzt werden. Dabei kann zwischen offener Beantwortung und der Auswahl von Antwortvorgaben unterschieden werden:

Bei der offenen Beantwortung erfolgt die Beantwortung frei, d.h. es sind keine Antwortauswahlmöglichkeiten vorgegeben. Ein Beispiel für eine offene Beantwortung wäre die Frage: In welchen Momenten liest du gerne? Hier ist zu erwarten, dass die Antworten sehr wenig durch Vorgaben der Forschenden begrenzt werden. Dies ist für explorative Zwecke sehr günstig, stellt aber hohe Anforderungen an die Auswertung. Ein anderes Beispiel wäre das Alter, welches mit folgender Frage ohne Antwortvorgaben erhoben werden kann: Wie alt bist du? Hier sind (von der Leserlichkeit der Antworten abgesehen) weder für das Antwortspektrum noch für die Auswertung besondere Vor- oder Nachteile im Vergleich zur Vorgabe von Antwortmöglichkeiten zu erwarten.

Bei Fragen mit Antwortvorgaben sind die Antwortmöglichkeiten vorgegeben, es handelt sich also um ein standardisiertes Fragenformat. Ein Beispiel für eine Frage mit Antwortvorgaben wäre also:
Besitzt du einen eBook-Reader? □ ja       □ nein

Hierbei lassen sich Fragen mit Einfachauswahl und mit Mehrfachauswahl unterscheiden. Bei der Einfachauswahl soll unter verschiedenen Antwortmöglichkeiten die am besten passende ausgesucht werden (wie z. B. die Frage nach dem Geschlecht). Bei der Mehrfachauswahl können mehrere Antwortalternativen ausgewählt werden. Ein Beispiel ist:

Aus welchen Gründen liest du?
□ Interesse am Inhalt des Textes
□ Interesse an der Sprache des Textes
□ Gewohnheit
□ Langeweile
□ Sonstige Gründe

Häufig sind Fragebögen so aufgebaut, dass verschiedene Aussagen vorgelegt werden, die auf einer Antwortskala, beispielsweise von 1 (trifft überhaupt nicht zu) bis 5 (trifft voll und ganz zu) bewertet werden sollen. Deshalb werden solche Antwortskalen auch als Ratingskala bezeichnet. Meist wird davon ausgegangen, dass die Abstände zwischen den Auswahlmöglichkeiten gleich sind und daher als metrisch betrachtet werden können (vgl. Beitrag zur Deskriptiven Statistik). Die Kombination aus Frage und Antwortmöglichkeit wird als Item bezeichnet.

Schritte bei der Erstellung eines Fragebogens

Im Folgenden können Sie die Erstellung eines Fragebogens schrittweise nachvollziehen. Der Fokus liegt dabei auf der Formulierung von Items zur Selbsteinschätzung. Die Auflistung kann auch für die Erstellung anderer Items nützlich sein, weitergehende Informationen finden Sie in der unten angegebenen Literatur.

Schritt 1: Festlegung der zu messenden Merkmale
Bei der Erstellung eines Fragebogens müssen Sie sich zunächst genau überlegen, welche Merkmale Sie messen wollen. Gehen wir davon aus, dass Sie den Zusammenhang zwischen dem Leseselbstkonzept und der Lesemotivation untersuchen wollen. Daraus ergibt sich, dass Sie das Merkmal Leseselbstkonzept und das Merkmal Lesemotivation erheben müssen.

Schritt 2: Recherche
Zu vielen Merkmalen existieren Fragebögen, die bereits eingesetzt wurden und zu denen Kennzahlen zur Qualitätsbestimmung vorliegen. Sie sollten also zunächst recherchieren, ob Sie auf der Arbeit von anderen aufbauen und sich damit selbst einige Mühe ersparen und besser an bereits bestehende Forschung anschließen können. Sollten Sie für Ihre Merkmale passende Fragebögen finden, rate ich Ihnen sehr, diese auch zu nutzen, besonders wenn diese schon mehrfach eingesetzt und damit getestet wurden. Auch hinsichtlich der vorliegenden Fragestellung existieren bereits Fragebögen. Für Demonstrationszwecke gehen wir im Weiteren allerdings davon aus, dass unsere Recherche erfolglos war und keine Vorarbeiten vorliegen, so dass wir einen neuen Fragebogen entwickeln müssen.

Schritt 3: Formulierung von Items
Zunächst müssen Sie sich überlegen (und dabei aktuelle Forschungsliteratur beachten), welche Indikatoren auf die Ausprägung dieser Merkmale hinweisen. Überlegen Sie sich dazu, woran eine niedrige oder hohe Ausprägung des Merkmals, welches Sie messen wollen, erkannt werden kann. Da Sie einen Fragebogen entwickeln wollen, müssen Sie sich im Weiteren auf solche Indikatoren beschränken, die über (Selbst)Auskünfte erfasst werden können. Für jedes Merkmal sollten Sie mehrere Items entwickeln. Für das Leseselbstkonzept könnten Sie beispielsweise folgende Aussage formulieren: Lesen fällt mir leicht. Für die Lesemotivation wäre eine Möglichkeit: Lesen macht mir Spaß. Zusätzlich müssen Sie sich für Antwortskalen entscheiden. Im vorliegenden Fall ist die schon vorgestellte Antwortskala von 1 (trifft überhaupt nicht zu) bis 5 (trifft voll und ganz zu) vorstellbar. Grundsätzlich sind auch andere Antwortskalen denkbar, z. B. zur Häufigkeit von 1 (nie) bis 5 (häufig).

Bei der Formulierung der Items sollten Sie Folgendes beachten: Grundsätzlich gilt, dass Sie sich bemühen sollten, die Aussagen möglichst klar, einfach und eindeutig zu formulieren. Sie sollten sich immer überlegen, ob Ihre Fragen wohl so verstanden werden, wie es von Ihnen intendiert ist. Weitere Hinweise zur Formulierung finden Sie bei Kallus (2010):

  • Ist das Sprachniveau angemessen?
    • Überprüfen Sie, ob Ihre Formulierungen für Ihre Zielgruppe verständlich sind. Fachbegriffe sollten Sie vermeiden, z. B. Ich bin intrinsisch motiviert.
  • Sind die Bezüge klar und eindeutig?
    • Ein problematisches Beispiel wäre: In meiner Schule gehöre ich zu den Besten im Lesen. Hier ist nicht eindeutig, auf wen sich der Vergleich bezieht. Es könnten sowohl ältere Schüler/-innen als auch die Lehrpersonen in den Vergleich einbezogen werden. Eine klarere Formulierung wäre: Im Vergleich mit den Mitschüler/-innen in meiner Klasse lese ich gut.
  • Entspricht jedes Item einem Aspekt?
    • Items, die mehrere Aspekte abfragen, können nicht eindeutig beantwortet werden, z. B.: Ich lese gerne Zeitung und Romane. Solche Items sollten Sie trennen und dafür zwei Items formulieren.
    • Auch Bedingungen innerhalb eines Items oder zwischen Items sollten Sie vermeiden, z. B. Wenn es Winter ist und ich ein gutes Buch zur Hand habe, lese ich manchmal den ganzen Tag.
  • Sind die Antwortkategorien passend?
    • Beispielsweise passt die Antwortskala von 1 (nie) bis 5 (häufig) nicht zu dem Item Meistens macht mir lesen Spaß.

Schritt 4: Formatierung des Fragebogens und Formulierung des Begleitschreibens
Auf die Formatierung sollten Sie einige Mühe verwenden, da eine eindeutige grafische Gestaltung die Verständlichkeit erhöht. Überprüfen Sie, ob alle Fragen gut lesbar sind und ob jeweils klar ist, welche Antworten zu welcher Frage gehören. Zusätzlich sollten Sie ein Begleitschreiben formulieren, das über die Ziele Ihrer Studie aufklärt und die Teilnehmenden motiviert, den Fragebogen auszufüllen. Hier sollte auch eine Instruktion zur Beantwortung des Fragebogens erfolgen. Das Begleitschreiben setzen Sie an den Anfang des Fragebogens. Wenn Sie minderjährige Personen befragen wollen, benötigen Sie eine Einverständniserklärung von den Eltern (s.a. Kapitel Forschung und Ethik). Der Einverständniserklärung sollten Sie ein Informationsschreiben beifügen.

Schritt 5: Erprobung des Fragebogens
Bevor Sie den Fragebogen einsetzen, sollten Sie ihn einigen Personen Ihrer Zielgruppe vorlegen, um zu überprüfen, ob alles verständlich ist. Dabei können Sie ausgefeilte Verfahren (diese finden Sie z. B. unter Stichwörtern wie kognitive Pretest) verwenden oder den Fragebogen einfach von 5-7 Personen ausfüllen lassen. Das Wichtigste ist, dass Sie sich Rückmeldung von Ihrer Zielgruppe holen. Tun Sie dies so frühzeitig, dass Sie notwendige Änderungen einarbeiten und den modifizierten Fragebogen erneut erproben können.

Nachdem mit Hilfe der kleinen Stichprobe die erste Einsatzfähigkeit sichergestellt ist, sollte der vorläufige Fragebogen an einer etwas größeren Stichprobe unter Echtbedingungen eingesetzt werden. Die dabei erhobenen Daten werden unter der Perspektive quantitativer Qualitätsindikatoren ausgewertet, um mangelhafte Items zu identifizieren. Vor dem eigentlichen Einsatz empfiehlt sich ein weiterer Probelauf mit der verbesserten Version.

Auswertung

Nachdem Sie Ihren Fragebogen eingesetzt haben, geht es an die Auswertung. Je nach Erkenntnisinteresse und Fragenform bieten sich hier verschiedene Verfahren an. Offene Fragen können Sie beispielsweise mit Hilfe der qualitativen Inhaltsanalyse auswerten, bei geschlossenen Fragen werden Sie vermutlich die deskriptiven Statistiken, Zusammenhänge oder Unterschiede interessieren. Insbesondere bei selbstentwickelten Fragebögen steht die Analyse der Qualitätseigenschaften des eigenen Fragebogens am Beginn der Auswertung.

Software

Zur Erstellung eines Papier-Fragebogens können Textbearbeitungsprogramme wie z. B. Word o.Ä. genutzt werden. Für Onlinebefragungen bieten sich Dienste wie Limesurvey (kostenfrei) oder Questback an.

Literatur

Aeppli, J. & Gasser, L. (2014). Empirisches wissenschaftliches Arbeiten. Ein Studienbuch für die Bildungswissenschaften (3. Aufl.). Bad Heilbrunn: Klinkhardt. (Kapitel 7)

Bortz, J. & Döring, N. (2006). Forschungsmethoden und Evaluation. Für Human- und Sozialwissenschaftler. Heidelberg: Springer.

Kallus, K. W. (2010). Erstellung von Fragebogen. Wien: Facultas. WUV.

Planung von Studien

Sabrina Wiescholek

Verhältnis von Theorie und Empirie

Aufgrund von systematischer Beobachtung mit Hilfe verschiedenster Erhebungs– und Auswertungsverfahren sammeln empirisch arbeitende Wissenschaftler/-innen Daten. Nach der Auswertung dieser Daten können Schlussfolgerungen gezogen werden. Genau diese Schlussfolgerungen führen zur Einwicklung von Theorien (induktives Vorgehen). So entstandene Theorien müssen jedoch weiterhin überprüft werden: Ist die Theorie überhaupt plausibel? Kann die Theorie auf andere Themengebiete übertragen werden? Hält die aufgestellte Theorie weiteren Beobachtungen stand, bewährt sie sich also? Dies alles sind Fragen, mit denen sich wiederum die empirische Wissenschaft beschäftigt. Durch Prüfung präzise formulierter Forschungsfragen bzw. der daraus abgeleiteten Hypothesen wird die Theorie verworfen, weiterentwickelt und wenn nötig verändert (deduktives Vorgehen).

 

Empirie-Theorie

Abb.: Wechselspiel von Theorie und Empirie aus: Imhof (2010), S. 18

 

Theorie und Empirie stehen in einem ständigen Wechselverhältnis zueinander. Stellen Sie sich zur Veranschaulichung dieses Wechselverhältnisses von Theorie und Empirie folgendes Beispiel vor, eine typische Situation im Klassenraum der 6a: Sie beobachten als angehender Lehrer/angehende Lehrerin während Ihres Praktikums jeden Tag, dass die Schülerinnen und Schüler in der sechsten Schulstunde besonders laut und unaufmerksam sind. Sie können sich kaum konzentrieren und Aufgaben werden meist nicht richtig zu Ende geführt. Des Weiteren beobachten Sie, dass sich die Schülerinnen und Schüler an einem Tag der Woche, am Donnerstag, anders verhalten. In der sechsten Stunde des Donnerstages ist das Verhalten der Schülerinnen und Schüler relativ unauffällig. Im Unterricht herrscht eine rege Beteiligung und die Lehrerin in der Stunde gibt den SuS nie Hausaufgaben auf, weil Sie alles innerhalb dieser sechsten Stunde bereits erledigen. Nach einem Gespräch mit der Klassenlehrerin erfahren Sie, dass die Schülerinnen und Schüler der 6a immer am Donnerstag in der fünften Stunde Sport haben. Sie entwickeln nun auf Grund Ihrer Beobachtungen die Theorie, dass die sportliche Betätigung der SuS zu einer erhöhten Konzentration führt, kurz: Sport führt zu mehr Konzentration und besserer Arbeitsleistung. Diese Theorie ist jedoch noch ziemlich wackelig, denn sie stützt sich allenfalls auf ihre vereinzelten Beobachtungen.

Zu vielen verschiedenen Themen bzw. Theorien existiert bereits Forschung und Literatur. Nicht nur aus Beobachtungen, sondern auch aus Literatur zu einem bestimmten Thema kann eine Theorie entwickelt werden. So können nicht nur durch Beobachtungen Fragestellungen entstehen, sondern auch auf Grund der Auseinandersetzung mit Literatur. Aus der Theorie werden Forschungsfragen entwickelt und Hypothesen abgeleitet, die es zu überprüfen gilt. Bestätigen sich die Hypothesen, ist die Theorie vorerst bewährt. Bestätigen sich die Hypothesen nicht, muss die Theorie entweder weiterentwickelt, verändert oder sogar vollständig verworfen werden.

Fragestellung:

Warum ist eine präzise Fragestellung so wichtig für die empirische Forschung? Die Fragestellung begleitet den/die Wissenschaftler/-in durch den gesamten Forschungsprozess. Anhand der Fragestellung entscheidet sich, welche Hypothesen zu prüfen sind, welche Erhebungs- und Auswertungsmethoden qualitativer oder quantitativer Art zur Prüfung der Hypothesen in Frage kommen und innerhalb welchem Forschungskontexts und Umfangs die Ergebnisse interpretiert werden können.

Im obigen Beispiel wird das Verhalten von SuS im Klassenraum diskutiert. Wichtig für eine empirische Studie ist eine möglichst konkrete Fragestellung. Was unterscheidet nun eine Fragestellung von einem Thema? Wann ist eine Fragestellung präzise formuliert, so dass Sie den Forschungsprozess konstruktiv leiten und begleiten kann? Am obigen Beispiel und weiteren anderen Beispielen wird im Folgenden veranschaulicht, wie sich das Thema und die Fragestellung unterscheiden, genauer gesagt, wie eine präzise Fragestellung aus einem Thema abgeleitet werden kann. Das in Kapitel 1.1 beschriebene Beispiel der Klasse 6a kann grob dem Thema „Konzentration im Unterricht“ zugeordnet werden. Hinsichtlich dieses Themas kann jedoch sehr viel Verschiedenes gefragt werden. Zum Beispiel: Wie macht sich die Konzentration von SuS bemerkbar? Was ist Konzentration? Wie kann Konzentration im Unterricht gefördert werden? All diese Fragen betreffen das Thema „Konzentration im Unterricht“, beziehen sich jedoch nicht auf die Beobachtung unseres Beispiels. Die konkrete Forschungsfrage passend zu den Beobachtungen in der 6a würde folgendermaßen lauten: „Welchen Einfluss hat der Sportunterricht auf die Konzentrationsfähigkeit von SuS der sechsten Klassen?“

Nachfolgend sollen einige Themen und passende Fragestellungen exemplarisch den Unterschied von Thema und Fragestellung veranschaulichen:

Thema Forschungsfrage
Lesemotivation von SuS
  • Wie kann Lesemotivation von SuS in der Hauptschule gefördert werden?
  • Wie lassen sich Geschlechterunterschiede in der Lesemotivation von Jugendlichen erklären?
  • Welchen Einfluss hat das Leseselbstkonzept auf die Lesemotivation von Grundschülern/Grundschülerinnen der vierten Klasse?
Unterrichtsstörungen
  • Welche theoretischen Ansätze zum Thema Unterrichtsstörungen gibt es?
  • Welchen Einfluss hat ein systematisch organisierter Unterricht auf die Häufigkeit von Unterrichtsstörungen?
Klassenklima
  • Wie kann das Klassenklima positiv beeinflusst werden?
  • Welchen Einfluss hat das Klassenklima auf das Wohlbefinden des/der einzelnen Schülers/Schülerin?
  • Weisen Klassen mit positivem Klassenklima eine bessere Schulleistung auf als Klassen mit schlechtem Klima?

Die Formulierung einer stichhaltigen Fragestellung gehört zu den allgemeinen Vorbereitungen einer empirischen Untersuchung. Es ist wichtig, dass schon bei der Formulierung der Fragestellung darauf geachtet wird, möglichst auf umgangssprachliche Formulierungen zu verzichten. Im Rahmen dieses Schrittes ist des Weiteren, wie oben schon erwähnt, zu prüfen, ob bereits Theorie zu der eigenen Fragestellung existiert. Welche Hypothesen wurden bereits geprüft? Welche Forschungsergebnisse existieren bereits?

Stellenwert von Hypothesen im Forschungsprozess

Die vermuteten Antworten auf eine Fragestellung werden als Hypothesen bezeichnet. Hypothesen können geprüft werden, wenn sie falsifizierbar, also widerlegbar sind. Ein Beispiel für eine schwer zu widerlegende Hypothese ist die Behauptung: „Es gibt blaue Bäume.“ Auf der einen Seite ist die Hypothese bestätigt, wenn ein blauer Baum gefunden werden würde. Dies kann sich allerdings als ein sehr langwieriges Vorhaben herausstellen. Auf der anderen Seite, müssten, um die Hypothese zu falsifizieren, alle auf der Erde existierenden Bäume betrachtet werden. Aber auch danach wäre es schwer festzustellen, ob nicht doch irgendwo ein blauer Baum existiert. Bei der Aussage „Es gibt blaue Bäume“ handelt es sich um eine Existenzaussage. Die Schwierigkeit bei einer solchen Aussage liegt darin, sie zu widerlegen. Dieses Beispiel veranschaulicht die Notwendigkeit, dass wissenschaftliche Hypothesen potentiell falsifizierbar, also durch systematische Beobachtungen generell überprüfbar sein müssen.

Bei Hypothesen kann zwischen Unterschieds-, Zusammenhangs- und Veränderungshypothesen unterschieden werden. Unterschiedshypothesen postulieren einen Unterschied, bspw. zwischen zwei Gruppen. (Beispiel: Ziffernzeugnisse werden von SuS besser verstanden als verbale Beurteilungen). Zusammenhangshypothesen beziehen sich auf den Zusammenhang zwischen zwei Merkmalen (Beispiel: Die Motivation der SuS hängt positiv mit den Leistungen im abschließenden Test zusammen). Veränderungshypothesen beschreiben demgegenüber Veränderungen über die Zeit (Beispiel: Die Leistungen der SuS steigen vom Anfang bis zum Ende des Schuljahres).

Variablen

Unsere Hypothesen beinhalten verschiedene Variablen. Was sind nun aber Variablen? Es wird unterschieden zwischen manifesten und latenten Variablen. Manifeste Variablen sind Aspekte bzw. Untersuchungsgegenstände, welche direkt beobachtet werden können. Zum Beispiel kann bei den Bundesjugendspielen die Schnelligkeit im 100-Meter-Lauf direkt mit Hilfe einer Stoppuhr gemessen werden. Latente Variablen sind im Gegensatz zu manifesten nicht unmittelbar beobachtbar. Beispielsweise muss zuerst operationalisiert werden, was mit „körperlicher Fitness“ gemeint ist. Es müssen demnach Aspekte gefunden werden, die auf eine körperliche Fitness schließen lassen. Dies kann zum Bespiel die Schnelligkeit im 100-Meter-Lauf sein, aber auch die Ausdauer,  die Beweglichkeit, die Muskelmasse u.v.m. Eine weitere Unterscheidung kann hinsichtlich der Funktion von Variablen getroffen werden. Variablen lassen sich in dem Fall in unabhängige (uV) und abhängige Variablen (aV) unterschieden. Diese Differenzierung drückt ihre Beziehung innerhalb einer Hypothese aus. Wir werden im Kapitel 1.6, in welchem verschiedene Untersuchungsdesigns vorgestellt werden, näher auf die Beziehung zwischen abhängigen und unabhängigen Variablen eingehen.

Eine weitere Unterscheidung hinsichtlich der Funktion von Variablen ist die Einteilung in unabhängige und abhängige Variablen. Wir werden im Kapitel über die Untersuchungsdesigns weiter darauf eingehen.

Probleme der Operationalisierung

Für die Spezifizierung Ihrer Untersuchung ist es unerlässlich, diejenigen Aspekte bzw. Variablen, welche Sie untersuchen wollen, zu definieren. Das richtige Fachwort hierfür ist „Operationalisierung“. Mit der Operationalisierung stellt sich die Frage nach dem, was überhaupt gemessen werden soll. Bei der oben gestellten Forschungsfrage nach dem Einfluss des Klassenklimas auf die Leistung der SuS ist es notwendig, mehrere Aspekte genau zu operationalisieren. Auf der einen Seite muss die Frage beantwortet werden, was unter dem Begriff Klassenklima verstanden und ab wann dieses als positiv bezeichnet werden kann. Es steht die Entscheidung aus, wie das Klassenklima in der Untersuchung erhoben werden soll? Wer, wie und was genau soll befragt werden? Auf der anderen Seite muss genau festgelegt werden, was mit Schulleistung gemeint ist. Schulleistung kann auf Grundlage von Noten, Leistungs- oder Intelligenztests ermittelt werden. Die Schulleistung eines einzelnen Schülers, aber auch der ganzen Klasse kann für die Untersuchung relevant sein. In der möglichst genauen Operationalisierung von Variablen bestimmt sich häufig die Güte einer Untersuchung.

Als Exkurs soll an dieser Stelle kurz auf die Qualität bzw. die Güte empirischer Forschung eingegangen werden, welche sich anhand verschiedener Kriterien beurteilen lässt. Es werden in der Regel drei Gütekriterien voneinander unterschieden: die Objektivität, die Reliabilität und die Validität. Die Objektivität betrifft die Unabhängigkeit der Untersuchung von dem Testleiter. Sie ist im gesamten Forschungsprozess (Durchführung, Auswertung und Interpretation der Untersuchung) relevant. Die Betrachtung von Reliabilität beschäftigt sich mit der Frage der Genauigkeit einer Messung. Eine Messung ist reliabel, wenn ein Merkmal exakt, also ohne Messfehler, gemessen wird. Wird zum Beispiel die Rechenleistung eines Schülers zu zwei verschiedenen Messzeitpunkten mit gleichen Testverfahren gemessen und wird davon ausgegangen, dass zwischen den beiden Messzeitpunkten keine Veränderung stattgefunden hat, muss ein reliabler Test dasselbe Testergebnis hervorbringen. Der Schüler müsste also zu beiden Messzeitpunkten dieselbe Rechenleistung aufweisen. Um die Reliabilität zu bestimmen, gibt es bestimmte Testverfahren, wie die Retest-Reliabilität, die Paralleltest-Reliabilität, die Interrater-Reliabilität (besonders für qualitative Forschung), die Testhalbierungs-Reliabilität oder die interne Konsistenz. An dieser Stelle soll jedoch nicht weiter darauf eingegangen werden. Die Validität beschäftigt sich im Gegensatz zur Reliabilität mit der Frage, ob tatsächlich das gemessen wird, was gemessen werden soll. Dabei kann zwischen interner und externer Validität unterschieden werden. Diese Formen von Validität nehmen einen übergeordneten Blick auf die gesamte Planung einer Untersuchung ein. Die interne Validität betrifft die Untersuchung selbst. Sind die Beobachtungen und Befunde innerhalb einer Studie tatsächlich darauf zurückzuführen, was gemessen wurde und was als ursächliche Variable angenommen wurde? Hingegen dazu geht es bei der externen Validität um die Generalisierbarkeit der Ergebnisse. Können die Ergebnisse einer Untersuchung über die Stichprobe hinweg verallgemeinert werden?

Versuchsdesigns/Versuchsplan/Versuchsanordnung

Ist eine Fragestellung konkret formuliert und sind daraus Hypothesen abgeleitet, müssen wir uns nun damit beschäftigen, wie und welche Daten passend zu unserer Fragestellung erhoben werden. Beller (2008) formuliert für diesen Schritt folgende Frage: „ Wie ist die Untersuchung zu gestalten, damit die Fragestellung überhaupt sinnvoll beantwortet werden kann?“

Je nachdem, welche Hypothesen geprüft werden sollen, bieten sich unterschiedliche Untersuchungsdesigns an. Dies hängt eng damit zusammen, um welche Art von Hypothese es sich handelt. Oben wurden drei Arten von Hypothesen vorgestellt: Unterschieds-, Zusammenhangs-, und Veränderungshypothesen.

Zum Betrachten von Zusammenhangshypothesen, also z. B. der Hypothese: „Je höher ausgeprägt das lesebezogene Selbstkonzept des Schülers/der Schülerin ist, desto höher ist auch seine/ihre Lesemotivation“, eignen sich am besten korrelative Studien. Hier werden verschiedene Variablen, in unserem Fall, das lesebezogene Selbstkonzept und die Lesemotivation betrachtet, erhoben und deren statistischer Zusammenhang berechnet. Hier gehen wir noch genauer auf die Auswertung hinsichtlich der Zusammenhangsmaße ein. An dieser Stelle sei nur schon einmal auf die Limitation von korrelativen Studien hingewiesen. Korrelationen veranschaulichen ausschließlich den statistischen Zusammenhang zwischen zwei Variablen, es kann keine Wirkrichtung, also Kausalbeziehung ausgedrückt werden. Was hier verglichen wird, sind immer mehrere unabhängige Variablen (uVs).

Einen Vorteil hinsichtlich der Aussagen zur Kausalität bietet das Experiment. Verglichen wird dabei der Einfluss von unabhängigen Variablen (aV) auf eine oder mehrere abhängige Variablen (uV). Dabei wird meist eine unabhängige Variable verändert, um den Einfluss dieser auf die abhängige Variable zu prüfen. Betrachten wir in diesem Fall die Hypothese, dass die Lesehäufigkeit die Leseleistung positiv beeinflusst. Die abhängige Variable ist hier die Leseleistung, die unabhängige die Lesehäufigkeit. Mit Hilfe eines Experimentes können wir diese Hypothese folgendermaßen prüfen: Wir wählen verschiedene sechste Klassen aus mehreren Realschulen aus. Diese Klassen erhalten in ihrem Unterricht extra Lesezeit zur Verfügung (Experimentalgruppe). Alle anderen Klassen der beteiligten Realschulen erhalten keine extra Lesezeit (Kontrollgruppe). Die Leseleistung wird nun in Kontroll- und Experimentalgruppe sowohl vor Einführung der zusätzlichen Lesezeit gemessen als auch ca. ein halbes Jahr danach. Die aufgestellte Hypothese lässt sich bestätigen, wenn die Experimentalgruppe zum zweiten Messzeitpunkt eine bessere Leseleistung aufzeigt, als die Kontrollgruppe. In einem solchen Schulsetting besteht die Möglichkeit, dass andere Variablen, wie z.B. der Deutschunterricht der Lehrkraft, die Konzentrationsfähigkeit bzw. Intelligenz der SuS als so genannte Störvariablen das Untersuchungsergebnis indirekt bedingen. In Experimenten, bei denen in einer natürlichen Umgebung etwas verändert wird, z.B. in der Schule, im Kindergarten oder in anderen Institutionen, wird somit von einem Feldexperiment oder einem quasiexperimentellen Design gesprochen.  Es sollte versucht werden, Unterschieden, welche sich auf Grund der Gruppeneinteilung ergeben, durch Randomisierung, also einer zufälligen Zuteilung der Testpersonen zu Experimental- und Kontrollgruppe, gerecht zu werden.

Das eben beschriebene Untersuchungsdesign lässt sich als Prä-, Post-, Kontrollgruppendesign bezeichnen. Es eignet sich, wie das Beispiel der Lesehäufigkeit veranschaulicht, sehr gut, um die Wirksamkeit von bestimmten Fördermaßnahmen, Unterrichtsmethoden usw. zu überprüfen.

Betrachten Wir nun Untersuchungsdesigns, die herangezogen werden, um Veränderungen zu messen. Mit Hilfe eines Querschnittsdesigns werden unterschiedliche Gruppen bzw. Kohorten zu einem bestimmten Messzeitpunkt untersucht. Kohorten können beispielsweise Jahrgänge, Altersgruppen, Berufsgruppen u.a. sein. So arbeitet z.B. die große Schulleistungsvergleichsstudie PISA mit einem Querschnittsdesign. Zum selben Messzeitpunkt wird in allen OECD-Ländern derselbe bzw. den bestimmten Ländern angepasste Schulleistungstest bei 15-jährigen SuS durchgeführt. Die Leistungsergebnisse der SuS in den einzelnen Ländern können dann miteinander verglichen werden. Was ein Querschnittsdesign nicht leisten kann, ist der Vergleich auf individueller Ebene über einen bestimmten Zeitraum hinweg. Das heißt z.B. die Veränderung individueller Schulleistung über die gesamte Schulzeit.

Soll dies das Ziel einer empirischen Studie sein, bietet sich als Untersuchungsdesign der Längsschnitt an. Hier werden über mehrere Messzeitpunkte hinweg dieselben Personen (dieselbe Stichprobe) immer wieder untersucht. Zur Veranschaulichung kann die Forschungsfrage „Wie entwickelt sich die Lesemotivation im Laufe der Schulzeit?“ herangezogen werden. Daraus kann die Hypothese abgeleitet werden, dass die Lesemotivation im Laufe der Schulzeit immer geringer wird. Folglich werden mehrere Messzeitpunkte benötigt, um diese Hypothese zu prüfen: Die erste Messung müsste zu Beginn der Schulzeit stattfinden; weiterführend könnte in der Mitte und am Ende der Grundschulzeit gemessen werden. Im Idealfall würden die an der Messung beteiligten SuS auch in der weiterführenden Schule an mehreren Erhebungen (5., 7., 10., 12. Schuljahr) teilnehmen. So kann ein Überblick über die gesamte Schullaufbahn gegeben werden. Allein für diese beim ersten Anblick sehr simpel erscheinende Forschungsfrage ergeben sich 7 Messzeitpunkte, die SuS würden über zwölf Jahre begleitet werden. Es wird deutlich, welche Schwierigkeiten mit einer Längsschnittuntersuchung verbunden sind:

  • Längsschnittuntersuchungen können mitunter sehr aufwendig bzw. zeitaufwendig sein.
  • Wenn Leistungstests in Längsschnittuntersuchungen eingesetzt werden, kann es zu einem Übungseffekt kommen: Bearbeiten SuS immer wieder in kurzen Abständen dieselben Aufgaben, merken sie sich die Lösungen.
  • Je länger der Zeitraum der Untersuchung, umso größer ist die Wahrscheinlichkeit eines Drop-Offs (Ausfall von Versuchspersonen; Selektivität). Der größte Drop-Off bei Unserem Beispiel wäre im Übergang von der Grundschule zur Weiterführenden Schule zu befürchten, da die SuS an viele verschiedene weiterführende Schulen wechseln. Aufgrund von Anonymisierung (siehe Kapitel zu Forschung und Ethik) ist schwer nachzuvollziehen, welche SuS an welche Schulen wechseln.

Wird Quer- und Längsschnittdesign kombiniert, kann von einem Kohorten-Sequenz-Design gesprochen werden. Dies ist die sowohl die zeitaufwendigste als auch die kostenintensivste Form der Untersuchungsdesigns. Es werden hier mehrere Kohorten, also z.B. Grundschüler/-innen der 3. und 4. Klasse sowie SuS der weiterführenden Schulen in der 5., 7. und 10. Klassen zu mehreren Messzeitpunkten untersucht. Eine gute Beispielstudie für das Kohorten-Sequenz-Design ist das Nationale Bildungspanel (NEPS) der Universität Bamberg.

Zum Abschluss des Kapitels soll an zwei Fragestellungen in der folgenden Tabelle der Weg von der Fragestellung über die Hypothese zum Untersuchungsdesign noch einmal veranschaulicht werden.

 

Beispiele der Untersuchungsplanung:

 Fragestellung

Lernen SuS besser mit Graphiken und Bildern oder aus Texten? Wie hängt das Bildungsniveau der Eltern mit der Leseleistung von SuS zusammen?

 Hypothese

SuS lernen mit Hilfe von Graphiken und Bildern besser als aus Texten.(Unterschiedshypothese) Je höher das Bildungsniveau der Eltern ist, umso besser können SuS lesen.(Zusammenhangshypothese)

 Variablen

Lernleistungen (aV), Texte (uV), Bilder und Graphiken (uV) Bildungsniveau der Eltern (uV), Leseleistung der SuS (uV)

Untersuchungs-

design

Prä-Post-Kontrollgruppen-Design, Feldexperiment Korrelative Studie

 

Literatur

Beller, S. (2008). Empirisch forschen lernen. Konzepte, Methoden, Fallbeispiele, Tipps. 2. überarb. Aufl. Bern: Huber.

Imhof, M. (2010). Psychologie für Lehramtsstudierende (2. Aufl.). Wiesbaden: VS Verlag für Sozialwissenschaften.

Moosbrugger, H. & Keleva, A. (2012). Testtheorie und Fragebogenkonstruktion. Berlin: Springer.