Im Jahr 2019 fand die biennale Konferenz der European Association for Research on Learning and Instruction (EARLI) zuletzt in Präsenz statt, damals quasi „nebenan“ in Aachen. Nach einer pandemiebedingten Online-Ausgabe 2021 hießen uns und mehr als 2.500 weitere Teilnehmer*innen in diesem Sommer nun die Aristoteles Universität und die Universität von Makedonien in Thessaloniki zur bisher größten EARLI-Konferenz willkommen. Unter dem Motto „Education as a Hope in Uncertain Times“ wurde vom 22.-26. August 2023 in der griechischen Sommerhitze intensiv diskutiert, präsentiert und Networking betrieben. Wir waren als Projektteam auch dabei und möchten einige Einblicke in unsere Erlebnisse schildern.
Mit zwei Vorträgen von Thomas und Christoph und einem Posterbeitrag von Philipp war das PERFORM-LA-Team gut auf der Konferenz vertreten. Am frühen Mittwochmorgen berichtete Christoph über die Akzeptanz simulationsbasierter Prüfungsformate durch Lehramtsstudierende auf Basis von Befragungs- und Interviewdaten, bevor Thomas direkt im Anschluss die Pilotstudie seines Performanztests für das Unterrichtsfach Englisch (zur Erfassung von Feedbackkompetenz) vorstellte. Im Rahmen einer Postersession präsentierte Philipp am darauffolgenden Tag die Ergebnisse seiner Pilotstudie eines Performanztests für das bildungswissenschaftliche Studium (zur Erfassung von Beratungskompetenz).
Eine Frage der Validität
Bei insgesamt 2065 Beiträgen in 21Panels fiel es oft nicht leicht, sich für einzelne (und damit gegen viele andere) Sessions zu entscheiden – geschweige, die Highlights dieser intensiven Woche herauszufiltern. Ein Thema, dass uns jedoch in ganz unterschiedlichen Beiträgen immer wieder begegnete und das auch für unser Projekt eine wichtige Rolle spielt, war die Frage nach der Validität von Test- und Prüfungsinstrumenten. Insbesondere das Symposium „Examining the Validity of Standardized Approaches to Measuring Teaching Quality“ und die Diskussion der vier Beiträge durch Anna-Katharina Praetorius blieben Lea dabei in Erinnerung. Unterschiedliche Perspektiven auf die Validität der Erfassung von Unterrichtsqualität standen in den Beiträgen im Vordergrund: Der Vergleich zwischen Präsenz- und Online-Unterricht (Jaekel et al., 2023), die Validität von Schüler*inneneinschätzungen als Indikator von Unterrichtsqualität (Gisladottir et al., 2023), die Förderung der Beobachtungskompetenz von Lehrkräften bei der Beurteilung von Unterrichtsqualität in Unterrichtsbesuchen sowie Urteilsfehler und -tendenzen in Beobachtungsstudien zur Unterrichtsqualität. Anna-Katharina Praetorius von der Universität Zürich griff in ihrer Diskussion grundsätzliche Fragen zum Thema des Symposiums auf, zum Beispiel nach der Validität von master scorings (= Expert*innenurteilen), und gab uns damit noch etwas „food for thought“ für die restlichen Konferenztage auf den Weg.
Core Practices
Ein weiteres Highlight-Symposium für Thomas war das zu „The Development of Core Practices from a Cross-National Perspective.“ Die Thematik um Core Practices spielt ja auch in unserem Projekt eine große Rolle, und in diesem Symposium war Pam Grossman, die Mitbegründerin dieses Konzepts (vgl. Grossman, 2021), Co-Chair und hat in ein paar einleitenden Worten das Konzept kurz dargestellt. Sie nannte auch gleich mehrere Gründe, warum wir uns auf Core Practices fokussieren sollten: Fehlende Vision für das was wir als „guten Unterricht“ bezeichnen würden, das „Technologiedefizit“ in der Lehrkräftebildung sowie die fehlenden reliablen Messmöglichkeiten. Der letzte Punkt wurde auch von der Diskutantin Tina Seidel aufgeworfen – hoffentlich können wir mit unserem Projekt hier einen Beitrag leisten, Core Practices handlungsnah und möglichst valide messen und prüfen zu können. Es gab vier spannende Vorträge aus verschiedenen Nationen. Im ersten Vortrag von Hannah Westbroek et al. (2023) von der Vrije Universiteit Amsterdam ging es um eine motivationale Perspektive auf Core Practices und wie Lehramtsstudierende zwei verschiedene Kurse bewerten, in denen sie ihren eigenen Lernbedürfnisse nachgehen konnten. Im Beitrag von Kirsti Klette et al. (2023) der Universität Oslo ging es um die Theorie-Praxis-Verzahnung mit Core Practices. Sie haben untersucht, wie der Fokus auf Core Practices im Lernprozess Studierende dabei unterstützen kann z.B. ihren analytischen Blick zu schärfen. Im dritten Teil stellten Kjersti Waege et al. (2023) von der Norwegian University of Science and Technology eine Studie vor, in der es darum ging, inwieweit der Erwerb von Core Practices durch Team Teaching-Komponenten unterstützt werden kann. Der letzte Beitrag war eine deutsch-deutsche Koproduktion der Universitäten Freiburg und Lüneburg von Hadmut Hipp et al. (2023). Sie stellten unter anderem eine Studie vor in der sie untersucht haben, ob eine Reflektion über oder Ausüben einer Core Practice (am Beispiel des Ansatzes des Reciprocal Reading, Palinscar & Brown, 1984) in halbstandardisierten Rollenspielen gewinnbringender für Studierende sind.
Philipps Highlights standen ganz im Zeichen von Untersuchungen aus dem HaLev – The Center for Simulation in Education der Bar llan Universität in Israel. Das Zentrum entwickelte das erste simulationsbasierte Lernprogramm für die Lehrkräfteausbildung in Israel und bietet umfassende Kurse und Workshops an. Zudem unterstreicht die Finanzierung durch das Israelische Bildungsministerium, dass die Institutionalisierung eines solchen Zentrums möglich ist und zeigt somit auch für unser eigenes Projekt weitere Perspektiven auf. Vor diesem Hintergrund präsentierte Ronen Kasperski unter dem Titel „The differential effect of simulations on SEL among preservice, beginner, and experienced educators“ eine Studie, zur Untersuchung der Wirkung von klinischen Simulationen auf die Entwicklung sozial-emotionaler Lernkompetenzen bei Lehrkräften. Die Ergebnisse deuten auf einen Kompetenzzuwachs bei allen Gruppen hin, während sich Unterschiede bezüglich der einzelnen Berufsphasen abzeichnen. Lehramtsstudierende profitierten am meisten, gefolgt von Berufseinsteigern und erfahrenen Lehrkräften. Ähnliches konnte auch Shira Iluz mit ihrer Posterpräsenation unter dem Titel, „Simulation based learning for facilitating understanding of others’ emotions in preservice teachers“, zeigen. Sie betonte, dass die Verwendung von simulationsbasiertem Lernen, zur Förderung sozial-emotionaler Fähigkeiten von Lehrkräften, einen vielversprechenden Bestandteil der Lehrkräftebildung darstellt, bisher jedoch nur wenige Forschungsarbeiten existierten, die eine entsprechende Wirksamkeit nachwiesen. In diesem Zusammenhang stellte sie mit ihrer Studie ein validiertes Testinstrument vor, das als Proof-of-Concept-Nachweis belegt, dass schon ein einziger Tag Simulationstraining bei Lehramtsstudierenden helfen kann, ihr emotionales Wissen im Sinne einer Perspektivübernahme zu erweitern.
Und sonst so?
Neben Beiträgen, die Themen adressieren, mit denen wir uns auch in unserer eigenen Forschungsarbeit beschäftigen, bot die EARLI auch viele Vorträge in andere Bereiche der empirischen Bildungsforschung. Christoph ist bspw. der Vortrag von Christian Kraler et al. (2023) von der Universität Innsbruck im Gedächtnis geblieben, der von Sabrina Bacher präsentiert wurde. Darin berichtete sie von einer Befragung von N=133 angehender Lehrkräfte im Masterstudium, in denen diese nach ihren future visions gefragt wurden. Damit sind Einstellungen und Orientierungen bezogen auf eine (wünschenswerte oder befürchtete) Zukunft gemeint, die auch schon einen Einfluss auf das Handeln in der Gegenwart haben können. Die inhaltsanalytische Auswertung von drei langen offenen Antworten ergab, dass 51% der Studierenden eher neutral, 30% positiv und 19% pessimistisch auf die Welt im Jahr 2040 blicken. Dabei ließen sich ihre Antworten auf sechs Hauptkategorien beziehen: Digitalisierung, Gesellschaft, Wirtschaft, Nachhaltigkeit & Klima, formale Bildung und Konflikte & Krisen. Es ergab sich also ein sehr heterogenes Bild der future visions. Welchen Einfluss diese nun genau auf das Studium und auch das schulische Handeln in der Gegenwart haben, ist Gegenstand weiterer Schritte der Kolleg*innen aus Österreich. Ebenfalls interessant war der Beitrag „Don’t we need two control groups in large Randomized Controlled Trials?“ von Sarah Pariser & André Tricot (2023) von der Université Paris 8 bzw. Université Paul Valéry in Montpellier. Darin beschäftigten sie sich mit der Frage, warum viele in kontrollierten Studien beobachtete Effekte von Lehr-Lern-Innovationen für die Schule verschwinden, wenn sie in größerem Maßstab im Bildungssystem implementiert werden. Sie vermuteten, dass dies daran liegen könnte, dass auch die Lehrkräfte in Kontrollgruppen dieser Studien die typischen Voraussetzungen im Bildungssystem abbilden und daher schon im Studiendesign verschiedene Gruppen berücksichtigt werden sollten, um die Wirkung im Hinblick auf eine mögliche Implementation in die Praxis abzuschätzen. Sie schlugen daher vor, in randomisierten Interventionsstudien zwei Kontrollgruppen zu bilden: eine Gruppe aus (wie üblich) freiwillig teilnehmenden Lehrkräften und eine Gruppe aus unfreiwillig teilnehmenden Lehrkräften. An einer Beispieluntersuchung mit 43 Klassen konnten sie beobachten, dass sich zwischen den Klassen der beiden Arten von Kontrollgruppen tatsächlich unterschiedliche Ergebnisse ergaben, die darauf hinweisen, dass sich Verzerrungen in typischen Interventionsstudien für Lehr-Innovationen in der Schule ergeben. Als Physikdidaktiker freute sich Christoph aber auch über den Vortrag von Benedikt Gottschlich et al. (2023) von der Universität Tübingen, der von einer aufwändigen Interventionsstudie zum kontextorientierten Physikunterricht unter Feldbedingungen berichtete, in der sich aber entgegen der Erwartung kein Vorteil für einen Elektrizitätsunterricht mit Kontexten im Vergleich zu einem Unterricht ohne Kontexte zeigte. Gründe hierfür werden von den Kolleg*innen noch analysiert (ob eine zweite Kontrollgruppe sinnvoll wäre, ist auch hier eine interessante Frage 😉 ).
Wer arbeitet…
Als abschließendes Highlight der EARLI 2023 darf natürlich auch der Gesellschaftsabend nicht unerwähnt bleiben: Vor spektakulärer Kulisse luden die Organisator*innen am Freitagabend in den „Ippikos Members Club“ zu tollem Essen und Kulturprogramm in Form von traditionellen Musik- und Tanzbeiträgen und der Professor*innen-Rockband der gastgebenden Universitäten ein (vielleicht auch eine Idee für die UPB…?). Für uns ein großartiger Abschluss dieser sehr intensiven Konferenzwoche!
Wir bedanken uns herzlich für die tolle Organisation und Umsetzung dieser riesigen EARLI 2023 (darunter die Konferenz-App, Verpflegung, detaillierte Lagepläne und natürlich die Helfer*innen vor Ort!) und ganz besonders für die zahlreichen Vorträge, Anregungen und Diskussionen. Bis zum nächsten Mal!
Vorträge:
Daltoé, T., Maier, J., Ruth-Herbein, E., Goellner, R., Trautwein, U. & Fauth, B. C. (2023, 23. August). Classroom Observation Ratings of Teaching Quality – An Investigation of a Teacher Training. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
Gisladottir, B., Tengberg, M., Roe, A. & Christensen, A. S. (2023, 23. August). Student Perceptions as Indicator of Teaching Quality: A Report from Nordic Classrooms. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
Gottschlich, B., Burge, J.-P., Wilhelm, T., Dopatka, L., Spatz, V., Schubatzky, T.; Haagen-Schützenhöfer, C., Invanjek, L., & Hopf, M. (2023, 25. August). Does using real-world contexts in science teaching improve learning? A field study on electricity. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
Grossman, P. (Ed.). (2021). Teaching core practices in teacher education. Harvard Education Press.
Hipp, H., Holstein, A., Nückles, M., & Kleinknecht, M. (2023, 24. August). How Can the Acquisition of Core Practices be optimally fostered? A Research Agenda and First Results. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
Iluz, S., Yablon, Y. B. (2023, 24. August). Simulation based learning for facilitating understanding of others’ emotions in preservice teachers. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
Jaekel, A.-K. & Goellner, R. (2023, 23. August). Students’ Perceptions of Teaching Quality in In-person Classrooms and Distance Education. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
Kasperski, R., Hemi, M. (2023, 21. August). The differential effect of simulations on SEL among preservice, beginner, and experienced educators. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
Klette, K., Staal Jenset, I. & Brataas, G. (2023, 24. August). Using Core Practices to Improve Connections between Theory and Practice in Teacher Education. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
Kraler, C., Bacher, S., & Schreiner, C. (2023, 25. August). Future Vision of Teacher Education Students. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
Palinscar, A. S., & Brown, A. L. (1984). Reciprocal teaching of comprehension-fostering and comprehension-monitoring activities. Cognition and Instruction, 1(2), 117-175. (Online)
Pariser, S., & Tricot, A. (2023, 25. August). Don’t we need two control groups in large Randomized Controlled Trials?. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
Waege, K., Fauskanger, J. & Mosvold, R. (2023, 24. August). Supporting teachers’ learning through co-planning, rehearsing and co-enacting instruction. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
Westbroek, H., Kaal, A. & Donszelmann,S. (2023, 24. August). A motivational perspective on learning core practices: the case of a Dutch teacher education program. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
White, M. (2023, 23. August). Evaluating the Robustness of Observational Studies’ Results to Rater Error with a Linking Data Set. 20. Biennale Konferenz der European Association for Research on Learning and Instruction (EARLI), Thessaloniki, Griechenland.
Todsünde Nr. 3: Zu viele unausgereifte Reformen im Bildungssystem
In einer Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei betrachten wir, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Grundsätzlich ist daher hilfreich, das entsprechende Buchkapitel gelesen zu haben, was ich an dieser Stelle ausdrücklich empfehlen möchte. Thesen aus dem Buch werden im Konjunktiv als indirekte Rede wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll. Der vorherige, zweiteilige Beitrag zu dieser Reihe findet sich hier. An dieser Stelle kann ich auch schon einmal ankündigen, dass auch dieser Beitrag wieder aus zwei Teilen besteht.
Zum Abschied
Bevor wir in diesem Beitrag aber die dritte der vom Autor so bezeichneten zehn Todsünden der Schulpolitik betrachten, möchte ich die Gelegenheit nutzen, Heinz-Peter Meidinger, nachdem er nicht noch einmal zur Wiederwahl als Präsident des Deutschen Lehrerverbandes angetreten ist, einen etwas ruhigeren Ruhestand bzw. eine hoffentlich entspanntere Zeit zu wünschen. Er bleibt dem Verband als Ehrenpräsident erhalten und ich vermute, dass er sich auch in Zukunft immer mal wieder zu verschiedenen Bildungsthemen öffentlich äußern wird, so wie er das ja auch in seinem Buch schon getan hat. Und auch wir werden diese Blogreihe natürlich fortsetzen.
Nichts funktioniert, nichts wird geprüft
Zusammengefasst äußert Heinz-Peter Meidinger im Kapitel zur dritten Todsünde der Schulpolitik in gewohnt zugespitzter Sprache die Kritik, dass durch Bildungspolitker*innen in Schulen bzw. im Schulsystem in zu kurzer zeitlicher Abfolge zu viele Veränderungen vorgenommen werden, „welche Schulen und Lehrkräften eine kontinuierliche Bildungs- und Erziehungsarbeit unmöglich“ (Meidinger, 2021, 51) mache. Dabei gäbe es kaum erfolgreiche Bildungsreformen, die auch wirklich zu einer Verbesserung geführt hätten. Demgegenüber stünde eine Vielzahl von schlechten Veränderungen und Heinz-Peter Meidinger führt aus: „[…] ja eigentlich ist die bildungsdeutsche Bildungspolitik der Nachkriegsgeschichte nichts anderes als eine Aneinanderreihung mehrheitlich gescheiterter Reformen […]“ (Meidinger, 2021, 52).
Als Gemeinsamkeit gescheiterter Reformen benennt Heinz-Peter Meidinger, dass diese „in aller Regel weitgehend ohne vorherige Erprobung, ohne Modellversuche und Evaluationsphasen sowie ohne Beteiligung von kompetenten Schulpraktikern“ (Meidinger, 2021, 52f.) umgesetzt würden. Unabhängig davon, ob das für spezifische Veränderungen zutrifft oder nicht, würde ich selbstverständlich ebenfalls dafür plädieren, dass Interventionen in der Schule bzw. generell in der Bildung natürlich empirisch auf ihre Wirkung analysiert werden sollten, wie es ja auch in anderen gesellschaftlich relevanten Feldern getan wird (z.B. in der Medizin). Eine solche stärkere Orientierung an wissenschaftlicher Evidenz wird auch erwartungsgemäß mehr oder weniger explizit durch viele Bildungswissenschaftler*innen gefordert, wobei im Detail natürlich diskutiert werden muss, welche Art Evidenz gemeint ist und inwiefern vorliegende Evidenz auch konstruktiv in Bildungspraxis einfließen kann bzw. sollte (vgl. Bauer & Koller, 2023; Besa et al., 2023).
Heinz-Peter Meidinger nennt eine Reihe von Beispielen für aus seiner Sicht gescheiterte Bildungsreformen, die ohne ausreichende ergebnisoffene, wissenschaftliche Evaluationen umgesetzt worden seien, z.B. die Umstellung der neunjährigen Schulzeit am Gymnasium auf acht Jahre (siehe hierzu auch den ersten Beitrag unserer Blogreihe), die Einführung der Mengenlehre in der Grundschule in den 70er-Jahren des letzten Jahrhunderts (vgl. Hamann, 2018) oder die Rechtschreibreform (ich vermute, es ist die von 1996 gemeint, das geht aus dem Text leider nicht eindeutig hervor). Während diese Veränderungen eher kurz angerissen werden, werden drei Beispiele im Kapitel etwas ausführlicher erläutert bzw. argumentiert, warum diese negativ oder schädlich gewesen seien: der methodisch-didaktische Lehransatz „Lesen durch Schreiben“, der Fremdsprachenunterricht in der Grundschule sowie die Einführung von Bachelor- und Masterstudiengängen im Zuge der sogenannten Bolognareform. Diese drei werden im Folgenden daher auch vor dem Hintergrund von Ergebnissen der empirischen Bildungsforschung etwas genauer betrachtet.
„Schreiben nach Gehör“ in der Grundschule
Zum ersten dieser drei Beispiele möchte ich vorweg darauf hinweisen, dass ich selbst kein Sprachdidaktiker oder Elementarpädagoge bin. Es ist natürlich dennoch möglich, einen kurzen Überblick über den empirisch-fachdidaktischen Forschungsstand zu geben, auch wenn ich selbst keine vertieften Kenntnisse über die fachdidaktischen Feinheiten von Lehr-Lern-Konzeptionen in dem Feld habe. Mit dem, was in Medienberichten häufig als „Schreiben nach Gehör“ bezeichnet wird, ist meist das methodisch-didaktische Konzept „Lesen durch Schreiben“ gemeint, das in seiner ursprünglichsten Form von dem Schweizer Lehrer Jürgen Reichen konzipiert wurde (Reichen, 1988). Heinz-Peter Meidinger beschreibt die Methode zusammenfassend so, dass „sich Kinder das Schreiben am besten und am leichtesten selbst beibringen könnten“ oder als Methode „[…] mit der von Schülern zunächst alles so geschrieben wird, wie es klingt […]“) (jew. Meidinger, 2021, 54). Diese Beschreibung gibt das Konzept und die damit verbundenen Ziele natürlich nicht vollständig wieder (wobei man berücksichtigen muss, dass das gesamte Kapitel neun Seiten umfasst, auf denen alle drei Beispiele angesprochen werden).
Beispiel für eine Anlauttabelle, Bildnachweis: Wolfram Esser, Wikipedia (Link)
Worum handelt es sich also beim Konzept „Lesen durch Schreiben“? Auch, wenn man es hier natürlich auch nicht vollständig wiedergeben kann, lässt es sich grundsätzlich als umfassendes didaktisches Konzept für den sprachlichen Anfangsunterricht in der Grundschule verstehen, in dem verschiedene Kompetenzen erworben werden sollen (z.B. Lesekompetenz, Schreibkompetenz). Kennzeichnend für das Konzept in der ursprünglichen Form ist, dass im sprachlichen Anfangsunterricht Schüler*innen Angebote für eine möglichst selbstgesteuerte und individualisierte Auseinandersetzung mit sprachlichen Lerngegenständen gemacht werden sollten, was aber auch nach Reichen (1988) Phasen gemeinsamen Unterrichts im Klassenverband nicht ausschließt (vgl. Lorenz, 2017). Praktisch soll dies möglichst in Form des Werkstattunterrichts stattfinden, also in einer vorbereiteten Lernumgebung (mit Materialien etc.), die von den Schüler*innen relativ selbstständig genutzt wird. Reichen (1988) konkretisiert diese Prinzipien eines offenen, selbstgesteuerten Lernens für den Anfangsunterricht im Lesen und Schreiben, wobei er annahm, dass Kinder mit adäquaten Hilfsmitteln grundsätzlich selbst Lesen und Schreiben können. Nach dem Prinzip „Lesen durch Schreiben“ soll zuerst das Schreiben gelernt werden, „damit das Lesen sich dann mit der Zeit individuell als dessen Produkt gewissermaßen von selbst einstellt.“ (Lorenz, 2017, 34). Zentrales Hilfsmittel im Unterricht bildet eine Anlauttabelle, bestehend aus Buchstaben bzw. Buchstabenkombinationen und zugehörigen Bildern. Die Bilder sind so gewählt, dass die Bezeichnungen der Bilder mit dem zugehörigen Buchstaben beginnen und der Anlaut der Bezeichnung der Lautung des Buchstaben entspricht. Mit dieser Tabelle werden die Schüler*innen angeleitet, Wörter zu schreiben, indem Sie sie phonetisch schrittweise in einzelne Laute zerlegen (vgl. Funke, 2014). Ein damit verbundenes Ziel ist es auch, dass die Lernenden mit diesem Hilfsmittel selbst bestimmen können, was sie mit welcher Absicht schreiben möchten, und daher schon früh beginnen, selbst motiviert eigene Schriftprodukte zu erstellen.
Kann „Lesen durch Schreiben“ funktionieren?
Das Konzept wird innerhalb der Sprachdidaktik schon seit den 90er-Jahren des letzten Jahrhunderts aus theoretischen Gründen kontrovers diskutiert (vgl. Funke, 2014). Das betrifft zum einen die Merkmale der deutschen Sprache selbst. Sie ist keine reine Lautschrift, sondern bedeutungstragende Phoneme werden in der Schriftsprache auch durch abstraktere Lautschemata repräsentiert (Brendel et al., 2011). Dabei kann ein Phonem (also der Laut) auch durch unterschiedliche Grapheme (also dem zugehörigen Schriftausdruck) repräsentiert werden (vgl. Hess et al., 2020). Diese Unterschiede können nicht umfassend in einer Anlauttabelle dargestellt werden. Schüler*innen müssen sie sich daher über die Zeit (bewusst) aneignen, um orthografisch korrekt zu schreiben. Zum anderen bezieht sich ein Teil der Kritik auch auf die Empfehlungen Reichens (1988) zur Umsetzung seines Konzepts selbst. Beispielsweise war für ihn eine korrekte Rechtschreibung im Anfangsunterricht nicht zentral und er empfahl, geschriebene Wörter nur dann zu korrigieren, wenn sie gar nicht lesbar seien oder grobe Lautfehler enthalten; dies auch, um Motivation und Schreibfreude aufrecht zu erhalten (vgl. Lorenz, 2017). Die Schulung der korrekten Rechtschreibung sollte dementsprechend auch erst in der zweiten Klasse beginnen. Demgegenüber wird angenommen, dass die Kinderdurch das Fehlen des frühen Einübens korrekter Schreibformen kein korrektes schriftsprachliches, inneres Lexikon aufbauen könnten, und dies auch nicht angeregt würde, da im Anfangsunterricht kaum mit fremden Texten gearbeitet würde (z.B. Dürscheid, 2011). Insbesondere werden Schwierigkeiten für schwächere Schüler*innen mit geringerer phonologischer Bewusstheit auch mit nicht-deutscher Muttersprache vermutet (z.B. Valtin, 1998). Da die Schreib- und Lesekompetenz unabhängig voneinander aufgebaut werden (vgl. Bredel et al., 2011), wird zudem kritisiert, dass zuerst Schreiben gelernt und explizites Lesen lernen bewusst vermieden wird.
Grundsätzlich lässt sich die Arbeit mit Anlauttabellen auch durchaus in Modellen zur Beschreibung des Schriftspracherwerbs von Kindern einordnen. Beispielsweise erfolgt der Aufbau von schriftsprachlichen Fähigkeiten im Modell von Frith (1986) in mehreren Stufen, der mit unterschiedlichen Strategien verbunden ist (vgl. Schründer-Lenzen, 2013). In der ersten Stufe (logografische Strategie) orientierten sich Kinder zunächst an der Oberflächenstruktur der Schriftsprache, indem sie Zeichenfolgen auswendig lernen (z.B. den eigenen Namen). In der zweiten Stufe (alphabetische Strategie) verbinden Kinder die gesprochene Sprache mit der geschriebenen Sprache, indem sie zunächst gesprochene Laute mit unterschiedlichen Buchstaben verbinden. An dieser Stelle können Anlauttabellen verortet werden. Zugleich müssen die Lernenden in dieser Stufe lernen, dass das geschriebene Wort nicht rein der Lautsprache folgt (phonemisches Schreiben), was nach Kritiker*innen im Konzept „Lesen durch Schreiben“ nicht ausreichend gelänge bzw. angestrebt werde. In der dritten Stufe (orthografische Strategie) erkennen Schüler*innen zunehmend schriftsprachliche Strukturen (z.B. Ableitungen von Wortstämmen).
Zusammengefasst wird das Konzept bzw. die Umsetzung in Reinform innerhalb der Sprachdidaktik aus rein theoretischer Sicht schon seit Beginn kritisch diskutiert. Der Entwickler und die Nutzer*innen des Konzepts sehen dies erwartungsgemäß anders und gehen davon aus, dass negative Effekte nicht eintreten, die genannten Schwierigkeiten ausreichend berücksichtigt würden und mögliche Nachteile durch andere Vorteile (z.B. bezogen auf die Schreibmotivation) kompensiert würden (vgl. Reichen, 2006). Entscheidend ist aber auch bei didaktischen Lehr-Lern-Konzepten, wie sie nun tatsächlich wirken bzw. inwiefern die angestrebten Lernziele auch empirisch erreicht werden.
Wie kann man das nun überprüfen?
Heinz-Peter Meidinger beschreibt die Auswirkungen des Konzepts „Lesen durch Schreiben“ als äußerst negativ und kritisiert: „30 Jahre lang wurde die Wirksamkeit nie in einer umfassenden Studie überprüft […].“ (Meidinger, 2021, 55). Erst Prof. Dr. Una Röhr-Sendlmeier habe 30 Jahre nach praktischer Einführung des Konzepts eine solche Studie durchgeführt. Vermutlich bezieht sich Heinz-Peter Meidinger hier auf die Ergebnisse der Promotion von Dr. Tobias Kuhl (2020), einem (nun ehemaligen) Doktoranden von Frau Röhr-Sendlmeier. Das lässt sich allerdings nur aus der Beschreibung der Studie durch Heinz-Peter Meidinger schließen, da leider im Kapitel keine Quellenangabe gemacht wird.
Zunächst ist anzumerken, dass auch schon zuvor empirische Untersuchungen zur Wirksamkeit des Konzepts durchgeführt und veröffentlicht wurden (Funke, 2014). Um die Ergebnisse solcher Studien besser interpretieren zu können, ist es hilfreich, typische Schwierigkeiten zu berücksichtigen, die bei empirischen Wirksamkeitsuntersuchungen solch umfassender didaktischer Lehr-Lern-Konzepte auftreten können. Das betrifft zum ersten die Frage, woran man Erfolg oder Misserfolg erkennen kann. „Lesen durch Schreiben“ ist mit verschiedenen Zielen verbunden (z.B. Erwerb von Schreib- und Lesefähigkeit, Erhöhung der Schreibmotivation). Es muss also meist die Veränderung verschiedener Merkmale von Schüler*innengruppen geeignet erfasst werden. Zum zweiten bezieht sich das Konzept „Lesen durch Schreiben“ auf einen relativ langen Zeitraum, der zudem im Konzept selbst nicht genau abgegrenzt wird. Für eine Untersuchung muss daher geklärt werden, welche Gruppen von Schüler*innen wie lange eigentlich betrachtet werden sollen. Geht es bspw. nur um das erste Schuljahr oder muss eigentlich die gesamte Grundschulzeit betrachtet werden? Sollen Schüler*innen an der weiterführenden Schule untersucht werden? Je länger eine Untersuchung dauert, desto schwieriger ist sie natürlich praktisch durchführbar. Das ist insbesondere deshalb bedeutsam, da man zur Beurteilung der Wirksamkeit natürlich genügend Schüler*innen braucht, damit bei der erwartbaren Streuung überhaupt Durchschnittsunterschiede zwischen Gruppen festgestellt werden können. Zum dritten geht es auch häufig um die Frage, im Vergleich zu was eine Lehr-Lern-Konzeption wirksam ist. Beispielsweise werden Schüler*innen mit Hilfe des Konzepts „Lesen durch Schreiben“ wahrscheinlich mehr Schreib- und Lesefähigkeiten lernen, als wenn sie gar keinen Unterricht erhielten. Daher geht es auch meist um die Frage, ob der Ansatz wirksamer ist im Vergleich zu anderen möglichen Konzepten. Als Vergleichskonzept zu „Lesen durch Schreiben“ dient häufig Unterricht, in denen so genannte Fibeln eingesetzt werden (z.B. die Piri-Fibeln des Klettverlags, explizit nur als Beispiel erwähnt – nicht als Werbung oder Empfehlung). Dabei handelt es sich um Lehrtexte bzw. Unterrichtsmaterialien, die im Sinne eines Lehrgangs sachlogisch, kleinschrittig strukturiert sind und bei dem sich im zugehörigen Unterricht – zugespitzt formuliert – alle Kinder zu gleichen Zeiten mit den gleichen Materialien beschäftigen. Zum vierten besteht natürlich die Frage, wie genau, umfangreich und auch von den Konzeptentwickler*innen intendiert eine Konzeption auch wirklich im Unterricht durchgeführt wird. Werden z.B. nur einzelne Elemente übernommen oder wird einem Konzept vollständig gefolgt? Werden evtl. sogar verschiedene Konzepte vermischt, was im schulischen Unterricht eher der Regelfall zu sein scheint, insbesondere auch im Anfangsschreibunterricht (vgl. Bremerich-Vos & Wendt, 2019). Davon ist abhängig, ob bestimmte Wirkungen auch wirklich einer Konzeption zugeschrieben werden können oder nicht. Und zum fünften muss bei derartigen Vergleichen sichergestellt werden, dass andere Einflussfaktoren auf das Lernen (z.B. Vorwissen, Erstsprache der Schüler*innen) kontrolliert werden, um abschätzen zu können, welchen Effekt eine Methode bzw. ein Konzept allein hat (diese Schwierigkeiten spielte auch in unserem vorherigen Beitrag zu dieser Reihe eine große Rolle).
Grau ist alle Empirie…
Was liegen denn nun für empirische Ergebnisse zu „Lesen durch Schreiben“ vor? Funke (2014) betrachtet in einer sorgfältigen Metaanalyse die Ergebnisse von 16 Untersuchungen, die in zwischen 1985 und 2010 durchgeführt wurden, sich auf die Klassenstufen 1 bis 4 beziehen, als Vergleichsmaßstab Fibelunterricht nutzen und in denen Ergebnisdaten zu Lese- und/oder Schreibkompetenzen vorliegen. Für die Rechtschreibleistung am Ende von Klasse 1 ergab sich eine kleine Effektstärke von d=0.28 (SD=0.09) zugunsten des „Lesen durch Schreiben“-Konzepts. Grundsätzlich lässt sich aber beobachten, dass die Effekte in den jeweiligen Studien stark schwanken (mal zeigten sich bei „Lesen durch Schreiben“ Vorteile, mal gerade umgekehrt). „Die in den verschiedenen Stichproben gefundenen Effekte weichen so stark voneinander ab, dass man sie nicht als zufällige Varianten einer gemeinsamen Wirkgröße von ein- und derselben Ausprägung auffassen kann.“ (Funke, 2014, 27f.) Für die Klassen 2 bis 4 ergab sich eine homogenere kleine Effektstärke von d=-0.26 (SD=0.05) für die Rechtschreibleistung, also ein Nachteil für „Lesen durch Schreiben“. Generell wurden nur bei wenigen Studien die Voraussetzungen kontrolliert. Werden nur diese Studien einbezogen, ergibt sich kein signifikanter Effekt (d=-0.09. SD=0.15, p=0.57). Bzgl. der Leseleistung am Ende von Klasse 1 ergab sich eine kleine Effektstärke von d=-0.27 (SD=0.14), bezogen auf die Klassen 2-4 d=-0.05 (SD=0.09). Zusammengefasst ergab sich also insgesamt kein konsistentes Bild: Beim Lesen in den Klassen 2-4 keine Unterschiede, beim Schreiben Nachteile mit kleinem Effekt. Die Ergebnisinterpretation ist aber durch verschiedene Faktoren eingeschränkt. Neben der schon erwähnten fehlenden Kontrolle der Eingangsvoraussetzungen wurden unterschiedliche Erhebungsinstrumente genutzt und die Zuordnung der untersuchten Klassen erfolgte über Auskünfte der Lehrkräfte; es ist also nicht ganz klar, wie genau die Methoden auch tatsächlich umgesetzt wurden. „Denkbar ist auch, dass Lesen durch Schreiben-Lehrkräfte ihrem schulischen Umfeld nach keine Zufallsauswahl darstellen.“ (Funke, 2014, 36).
Es liegen seitdem auch aktuellere Analysen vor. Beispielsweise untersuchte Lorenz (2017) auf Basis von repräsentativeren Daten aus der Videostudie im Fach Deutsch des Projekts PERLE, inwiefern Zusammenhänge zwischen dem Einsatz des Konzepts „Lesen durch Schreiben“ und der Rechtschreibleistung von Schüler*innen in Klasse 1 bestehen. Basis sind freie Texte bzw. Briefe , die von N=508 Schüler*innen verfasst und hinsichtlich bestimmter Fehlerarten (z.B. bei der Groß- und Kleinschreibung) analysiert wurden. Die Schüler*innen wurden in vier Gruppen eingeteilt, die sich danach unterscheiden, wie sehr das Konzept „Lesen durch Schreiben“ nach Selbsteinschätzungen der unterrichtenden Lehrkräfte im Unterricht eine Rolle spielte (Stufen: dominant, wichtig, untergeordnet, keine Rolle). In differenzierten Mehrebenenanalysen ergab sich: „Kinder, in deren Deutschunterricht „Lesen durch Schreiben“ eine größere Rolle spielt, schreiben insgesamt einen höheren Anteil ihrer Wörter orthographisch falsch.“ (Lorenz, 2017) Diese Ergebnisse wurden mit einer verbesserten Analyse auch in Hess et al. (2020) berichtet. Auch die Ergebnisse einer Simulationsstudie mit Hilfe neuronaler Netze bestätigen die Nachteile des Konzepts in der Tendenz, wobei allerdings der zurückhaltende Umgang mit Fehlerkorrekturen nach den Empfehlungen von Reichen in den Vordergrund gestellt wurde und nicht die Arbeit mit der Anlauttabelle (Born et al., 2022).
Worauf bezieht sich Heinz-Peter Meidinger?
In der von Heinz-Peter Meidinger erwähnten Untersuchung von Kuhl (2020) wurden mit einem hohen methodisch-organisatorischem Aufwand drei Lehr-Lern-Konzepte für den Sprachanfangsunterricht betrachtet. Neben dem Fibelunterricht und „Lesen durch Schreiben“ auch „Graf Orthos Rechtschreibwerkstatt“, das kurz zusammengefasst einige Ideen von „Lesen durch Schreiben“ übernimmt, umfangreiche Selbstlernmaterialien bereitstellt (insbesondere mit Abschreibübungen), dies mit vielen individualisierten Lernphasen verbindet und in Klasse 1 ebenfalls bewusst wenige Fehlerkorrekturen einsetzt. Neben der Rechtschreibleistung wurden hier auch weitere mögliche Wirkungen der Konzepte (z.B. die Beschäftigung mit Schreiben oder Schrift in der Freizeit) untersucht. Basis bilden Daten von N=3084 Kindern von zwölf Schulen „im Umkreis von 50 km um Bonn“ (Kuhl, 2020, 84), wobei für die Längsschnittstudie zur Rechtschreibleistung Datensätze von N=284 Schüler*innen herangezogen wurden (es wurde auch eine Querschnittsuntersuchung durchgeführt). Insbesondere liegen zu diesen Schüler*innen auch Ergebnisse zu den Eingangsvoraussetzungen in die Grundschule vor (z.B. zur phonologischen Bewusstheit, Familiensprache). Von dieser Gruppe wurde ab Ende des ersten Schuljahres jedes Halbjahr bis zum Ende von Klasse 3 standardisiert die Rechtschreibleistung mit Hilfe der Hamburger Schreib-Probe 1 -10 (May, 2013) erfasst. Die Datenerhebung begann im Jahr 2013 und erstreckte sich dementsprechend über mehrere Schuljahre. Die Zuordnung der Schüler’*innen zu den untersuchten Konzepten erfolgte schulweise auf Basis von Angaben der Lehrkräfte und den in der Schule vorhandenen Materialien. Hierzu führt Kuhl (2020) aus: „Jede Schule hatte sich bereits vor der Akquise zur Studienteilnahme dafür entschieden, den Unterricht nach einem gemeinsamen Leitmedium zu gestalten. Es konnte davon ausgegangen werden, dass der Unterricht in der Realität graduell anders durchgeführt wurde, als er in der Theorie von den Entwicklern der verschiedenen didaktischen Ansätze erdacht worden war. […] Dennoch wurde der Unterricht durch die Entscheidung der Schule für einen spezifischen didaktischen Ansatz als Leitmedium maßgeblich geprägt. Deshalb erschien die Zuordnung des Unterrichts einzelner Schulen zu einer Didaktik als sinnvoll.“ (Kuhl, 2020, 71f.). Es wurde bewusst auf Unterrichtsbeobachtungen verzichtet.
Unterschiede zwischen den drei Gruppen wurden mittels Kovarianzanalysen mit Messwiederholung analysiert, wobei die Eingangsvoraussetzungen als Kovariate berücksichtigt wurden. Dabei ergaben sich große Unterschiede zwischen den drei Konzeptionen (F(2,277)=39.93, p<.001, η²=.247). Die Ergebnisse von Schüler*innen, die nach der Rechtschreibwerkstatt oder „Lesen durch Schreiben“ unterrichtet wurden, unterschieden sich nicht signifikant voneinander. Die Schüler*innen im Fibelunterricht allerdings erzielten mit jeweils großen Effekten bessere Rechtschreibleistungen im Vergleich zu den anderen beiden Konzepten zu allen fünf Messzeitpunkten. Am schwächsten Schnitt insgesamt die Rechtschreibwerkstatt ab. Die Unterschiede zwischen Fibelunterricht und „Lesen durch Schreiben“ verringerten sich im zeitlichen Verlauf etwas. Diese Unterschiede wurden auch in der Querschnittsuntersuchung bestätigt. Bezüglich der anderen untersuchten Variablen zeigten sich im Querschnitt dazu bspw. keine Unterschiede in der Lesemotivation oder der Schreibfreude zwischen den Gruppen. Insgesamt zeigt die Untersuchung also einen Vorteil von Fibelunterricht, für dessen Einsatz sich Kuhl (2020) in der Dissertation auch stark ausspricht, teilweise mit aus meiner Sicht überzogenen negativen Wertungen zu didaktischen Konzepten im Allgemeinen und den Fähigkeiten von Lehrkräften. Insbesondere halte ich es für durchaus sinnvoll, wenn Evaluationen im schulischen Setting auch von Pädagog*innen geplant und durchgeführt werden (vgl. Kuhl, 2020, 143), da auch beim Einsatz von Psycholog*innen und Sozialwissenschaftler*innen ein Priming basierend auf persönlichen Erfahrungen stattfinden kann. Die Forderung nach einer stärkeren Evidenzbasierung von schulischem Handeln und der forschungsbasierten Ausbildung von Lehrkräften teile ich aber ausdrücklich.
Es handelt sich insgesamt um eine aufwändige und sorgfältig durchgeführte Studie mit hoher methodischer Qualität in der Durchführung. Dennoch hat auch diese natürlich einige Limitationen, die die Aussagekraft ihrer Ergebnisse einschränken. Diese liegen insbesondere in der Gelegenheitsstichprobe (was nachvollziehbarerweise mit erhebungsökonomischen Gründen zusammenhängt), der Zuteilung der Schüler*innen zu den einzelnen Konzepten und darin, dass keine genauen Informationen zur Umsetzungstreue der Konzepte vorliegen. Kuhl (2020) argumentiert hierzu: „Es ist anzunehmen, dass sich nicht jeder Lehrer streng an die Vorgaben des Leitmediums gehalten hat und Material, das er als didaktisch sinnvoll erachtet hat, in seine Unterrichtsplanung und -durchführung einfließen ließ. Das Unterrichtsgeschehen unterschied sich demnach graduell zwischen den Klassen – auch innerhalb einer Schule. Dennoch haben sich die Lehrer oder der Rektor für ein Leitmedium entschieden, welches in sämtlichen Klassen einer Schule eingesetzt wurde und den ‚Kurs‘ des Unterrichts maßgeblich bestimmt hat.“ (Kuhl, 2020, 146). Diese Annahme ist nachvollziehbar, aber wird hier natürlich nicht empirisch genauer unterlegt. Es bleibt daher leider unklar, wie Rechtschreibunterricht nach der Anfangsphase in den untersuchten Grundschulen stattgefunden hat. Auch sind die Schüler*innen nicht gleichmäßig über die einzelnen Konzepte verteilt (bspw. im Längsschnitt folgendermaßen: Fibel: N=84 ; Lesen durch Schreiben: N=79, Rechtschreibwerkstatt: N=121), wobei die Unterschiede im Querschnitt noch größer sind. Daneben diskutiert bspw. Brügelmann (2020) auch weitere Aspekte der Studie kritisch, wie z.B. die nicht klare konzeptionelle Unterscheidung der verwendeten Ansätze, eine fehlende Auswertung auf Klassenebene, um den Faktor der Lehrkräfte zu kontrollieren, und, dass die Ergebnisse nicht auf die bundesdeutsche Normierung der Hamburger Schreibprobe bezogen würden: „Nach diesem bundesweit repräsentativen Maßstab entsprechen ‚Lesen durch Schreiben‘-Kinder in Kuhls Studie schon zum Ende des Anfangsunterrichts und über die Grundschulzeit hinweg der bundesdeutschen Norm. Sogar der Anteil besonders leistungsschwacher Schüler*innen ist niedriger als in der Bonner Gesamtstichprobe – besonders auffällig in Klasse 1 und 2. Die ‚Ausreißer‘ bilden die (zusammengefassten) Fibel-Klassen (nach oben) und die Rechtschreibwerkstatt-Klassen (nach unten).“ (Brügelmann, 2020, 3).
Und was heißt das jetzt?
Die vorliegenden Ergebnisse sprechen eher dafür, dass der Ansatz „Lesen durch Schreiben“ keine Vorteile, sondern tendenziell Nachteile gegenüber anderen Schreiblernansätzen im Anfangsunterricht hat. In diesem Sinne würde auch ich eher empfehlen, andere Ansätze im Schreibanfangsunterricht zu wählen, wobei – wie schon erwähnt – ich hierzu kein ausgewiesener Experte bin. Hier stimme ich Heinz-Peter Meidinger explizit zu. Allerdings zeigen die vorliegenden Ergebnisse auch nicht, dass Probleme mit der Rechtschreibleistung am Ende der Grundschule allein auf den Einsatz des Konzepts „Lesen durch Schreiben“ zurückgehen, was er – auch außerhalb seines Buches – anscheinend so interpretiert (z.B. hier). Ob ein Verbot von Methoden, wie im Kapitel zustimmend beschrieben, sinnvoll ist, sei einmal dahingestellt (Was soll denn auch genau verboten werden? Die Nutzung von Anlauttabellen, oder dass Rechtschreibfehler nicht korrigiert werden?). Aus Sicht der empirischen Bildungsforschung sei aber zumindest darauf hingewiesen, dass auch die Wirkungen anderer Lehr-Lern-Konzepte selten empirisch geprüft werden und so gut wie fast alle Konzepte „ohne jegliche empirische Evidenz und Erprobung eingeführt und nie evaluiert […]“ (Meidinger, 2021, 56f.) werden. Insofern könnte man die oben beschriebenen Untersuchungen auch als eine erfolgreiche Evaluation von Fibelunterricht interpretieren. Einführung von Konzepten bedeutet an dieser Stelle, dass entsprechende Materialien zur Nutzung im Unterricht zugelassen werden. Aufgrund der Autonomie von Lehrkräften ist der Einsatz spezifischer Lehr-Lern-Konzepte im Detail derzeit nicht vorschreibbar. Und welche Materialien auch außerhalb geschlossener Lehrwerke oder Konzepte von Lehrkräften tatsächlich eingesetzt werden, ist noch einmal eine ganz andere Frage.
Um diesen schon recht umfangreichen Blogbeitrag nicht zu sehr in die Länge zu ziehen, werden wir die anderen beiden von Heinz-Peter Meidinger genannten Beispiele für seine Todsünde Nr. 3 im zweiten Teil dieses Beitrags betrachten. Er wird an dieser Stelle verlinkt, sobald er online ist.
Literatur:
Bauer, J., & Kollar, I. (2023). (Wie) kann die Nutzung bildungswissenschaftlicher Evidenz Lehren und Lernen verbessern? Thesen und Fragen zur Diskussion um evidenzorientiertes Denken und Handeln von Lehrkräften. Unterrichtswissenschaft, 51(1), 123-147. (Online)
Besa, K. S., Demski, D., Gesang, J., & Hinzke, J. H. (Hrsg.) (2023). Evidenz-und Forschungsorientierung in Lehrer* innenbildung, Schule, Bildungspolitik und-administration: Neue Befunde zu alten Problemen. Springer Fachmedien Wiesbaden. (Online)
Born, J., Nikolov, N. I., Rosenkranz, A., Schabmann, A., & Schmidt, B. M. (2022). A computational investigation of inventive spelling and the “Lesen durch Schreiben” method. Computers and Education: Artificial Intelligence, 3, 100063. (Online)
Bredel, U., Fuhrhop, N., & Noack, C. (2011). Wie Kinder lesen und schreiben lernen. Gunter Narr Verlag.
Bremerich-Vos, A. & Wendt, H. (2019). Zur Nutzung von Laut- bzw. Anlauttabellen im Deutschunterricht der Grundschule. Zeitschrift für angewandte Linguistik, 70(1), 19–36. (Online)
Brügelmann, H. (2020). Einordnung der Ergebnisse der „Bonner Studie “zur Wirkung verschiedener Ansätze des Lese-und Schreibunterrichts auf die Entwicklung der Rechtschreibleistung im Verlauf der Grundschulzeit. (Online)
Dürscheid, C. (2011). „Schreib nicht, wie du sprichst.“ Ein Thema für den Deutschunterricht“. In B. Rothstein (Hrsg.), Sprachvergleich in der Schule (S. 89-109). Schneider.
Funke, R. (2014). Erstunterricht nach der Methode“ Lesen durch Schreiben“ und Ergebnisse schriftsprachlichen Lernens-Eine metaanalytische Bestandsaufnahme. Didaktik Deutsch: Halbjahresschrift für die Didaktik der deutschen Sprache und Literatur, 19(36), 21-41. (Online)
Frith, U. (1986). Psychologische Aspekte des orthografischen Wissens. In G. Augst (Hrsg.), New trends in Graphemics and orthography (S. 218–233). Berlin: de Gruyter.
Hamann, T. (2018). Die“ Mengenlehre“ im Anfangsunterricht: historische Darstellung einer gescheiterten Unterrichtsreform in der Bundesrepublik Deutschland (Siegener Beiträge zur Geschichte und Philosophie der Mathematik – Band 9). Universitätsverlag Siegen. (Online)
Hess, M., Denn, A. K., Kirschhock, E. M., Lorenz-Krause, A., & Lipowsky, F. (2020). Effekte der Konzeption „Lesen durch Schreiben “auf verschiedene Teilbereiche lauttreuer und orthografischer Verschriftung in der Mitte des ersten Schuljahres. Zeitschrift für Grundschulforschung, 13(2), 317-337. (Online)
Kuhl, T. (2020). Rechtschreibung in der Grundschule. Berlin: Springer. (Online)
Lorenz, A. (2017). Wer schreibt recht, wer schreibt schlecht?: Eine Untersuchung des Zusammenhangs zwischen der Rechtschreibleistung von Erstklässlern und dem Ansatz „Lesen durch Schreiben “von Jürgen Reichen in der Videostudie Deutsch des Projekts PERLE. kassel university press. (Online)
May, P. (2013). Hamburger Schreib-Probe 1-10 (HSP). Manual (Neunormierung 2012). Klett.
Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
Reichen, J. (2006). Hannah hat Kino im Kopf. Die Reichen-Methode Lesen durch Schreiben und ihre Hintergründe für LehrerInnen, Studierende und Eltern (4. Aufl.). Heinevetter.
Reichen, J (1988). Lesen durch Schreiben (3. Aufl.). sabe.
Schründer-Lenzen, A. (2013). Schriftspracherwerb. Springer VS. (Online)
Valtin, R. (1998). Der ‚neue‘ Methodenstreit oder: (Was) können wir aus der amerikanischen Leseforschung lernen? In H. Balhorn, H. Bartnitzky, & A. Speck-Hamdan (Hrsg.), Schatzkiste Sprache 1. Von den Wegen der Kinder in die Schrift (S. 14-46). Arbeitskreis Grundschule.
Am 27.06.2022 fanden unsere ersten Simulationen mit Studierenden in der Pilotierungsphase unserer Datenerhebung statt. Ziemlich genau ein Jahr später ist diese Phase nun vorläufig abgeschlossen. Nach 61 Simulationen in Englisch (10 in der Pilotierung und 51 in der Haupterhebung) und 72 in Bildungswissenschaften (9 in der Pilotierung in 63 in der Haupterhebung), haben wir die Haupterhebungsphase des Projekts (vorläufig) beendet. Nachdem wir euch schon einen Einblick in den Alltag unserer Simulationen gegeben haben, ist nun ein guter Punkt, um zurückzublicken und das letzte Jahr ein bisschen Revue passieren zu lassen!
Am Anfang stand die Frage…
„Du studierst Englisch oder ein anderes Fach auf Lehramt?“. Mit diesem Flyer (siehe unten) machten wir uns auf die Suche nach Studierenden, die an unseren Simulationen teilnehmen wollten. Wir reisten durch die Universität, um Poster aufzuhängen, machten Werbung in Vorlesungen und Seminaren, verteilten Flyer in der Mensa, teilten Posts auf Facebook und Instagram. Die Nachricht verbreitete sich anfangs allerdings eher schleppend, und nicht selten fragten wir uns, ob wir das Ziel von 50 Teilnehmenden pro Teilprojekt in der Haupterhebung überhaupt erreichen können. Doch mühsam ernährt sich das Eichhörnchen und nach und nach erreichten uns mehr und mehr Anmeldungen.
(c) Universität Paderborn, Johannes Pauly; Thomas Janzen
Eat, Sim, Sleep, Repeat
Von nun an hieß es montags und dienstags: Simulieren! In der Pilotierungsphase betrug die Dauer der Teilnahme noch drei Stunden, sodass wir jeweils am Tag bis zu zwei Simulationen anbieten konnten. Durch ein abgestimmtes System und drei verfügbaren Räumen, war es uns möglich, in beiden Projekten parallel zu erheben. In der Haupterhebung haben wir, durch einen stärkeren Fokus, die Teilnahmezeit auf etwa zweieinhalb Stunden verkürzen und somit bis zu 16 Termine in der Woche anbieten können.
„Casting is 85 to 90 percent of the picture for me”- Martin Scorsese
Was Scorsese sagt, trifft auch für unsere Simulationen zu. Ohne kompetente Schauspieler*innen ist es nahezu unmöglich, Daten mit der Qualität zu erheben, die für die Entwicklung und Validierung performanzorientierter Prüfungsformate notwendig sind. Möglich gemacht wurde das Ganze durch unsere Schauspielerinnen Elena, Hannah und Jasmin. Sie haben in den Simulationen von morgens bis abends die Rollen von Mia, Alex und Christina eingenommen. Um in den Situationen möglichst authentisch und standardisiert zu agieren, absolvierten sie ein mehrwöchiges Training und diverse Testdurchläufe mit Kolleg*innen des PLAZ und der Englischdidaktik Paderborn. Ab der Pilotierung lief es dann so gut wie von selbst: Es war auf einmal ganz natürlich erst eine unsichere 9. Klässlerin zu mimen und keine 20 Minuten später als Elternteil nicht ganz zu verstehen, warum man zum Elternsprechtag kommen muss. Den Einsatz und die Flexibilität unserer drei Schauspielerinnen können wir nicht genug honorieren!
Unser Simulationsteam (v.l.): Philipp Wotschel, Thomas Janzen, Jasmin Heinrichs, Elena Seifert und Hannah Grummel (c) Philipp Wotschel
Bridge over troubled water
Zum Forschungsalltag gehörte es auch, mit Unsicherheiten umgehen zu lernen. Termine von Studierenden wurden manchmal weit im Voraus, oftmals kurzfristig abgesagt – oder einfach kommentarlos ausfallen gelassen. Vor dem Hintergrund des organisatorischen Aufwands war dies vor allem zu Stoßzeiten, mit vielen Terminanfragen, besonders ärgerlich. Manchmal gab es kleine Zweifel, ob die erhoffte Zahl an Teilnehmenden noch zu erreichen ist.
Doch von nichts kommt nichts und zum Glück hatten wir auch viel Unterstützung von Kolleg*innen: Das gesamte Team der Englischdidaktik Paderborn hat es uns ermöglicht in Vorlesungen und Seminaren mehrfach Werbung für unser Projekt zu machen – unser Dank geht hier insbesondere an Dominik Rumlich und Katharina von Elbwart, sowie Peter Hohwiller, Maike Bauer, Julie Intveen, Jeanette Böttcher, Dagmar Keatinge, Heike Niesen und Benedikt Wagner. Das PLAZ Kommunikationsteam um Björn Herdeegen und Angelina Berisha sowie die Fachschaft Lehramt haben durch ihre Werbung auf Facebook und Instagram viel Aufmerksamkeit für unser Projekt geschaffen. Durch die Hilfe von Frauke Matz, Jens Folkerts und der gesamten Münsteraner Englischdidaktik konnten wir auch an der Universität Münster Studierende für unsere Erhebung gewinnen und unsere Simulationen vor Ort durchführen. Vielen, vielen Dank – ihr habt alle entscheidend zum Erfolg von PERFORM-LA beigetragen.
Selbstverständlich gilt unser größter Dank den Studierenden, die an unserer Studie teilgenommen haben. Ohne die Bereitschaft und das Vertrauen alles Teilnehmenden wäre die Umsetzung des Projekts nicht möglich gewesen.
Letztendlich haben wir es geschafft, genug Teilnehmende zu erreichen und können nun zufrieden mit den von uns erhobenen Daten in die nächste Projektphase gehen.
Cold hard facts
Was ist denn nun der Ertrag unserer Erhebung in ein paar konkreten Zahlen?
Insgesamt durchgeführte Simulationen: 123
Speichermenge der Aufnahmen (Videos + Audios der Interviews): ca. 200 GB
Laufzeit des Videomaterials: Über 1000 Minuten
What‘s next?
Der Ball liegt nun wieder in unserem Feld. Unser Ziel ist es jetzt zu schauen, inwieweit sich mit rollenspiel-basierten Simulationen valide Leistungen erheben und bewerten lassen. Daher befinden wir uns aktuell in der Entwicklung eines Bewertungsinstruments für die Simulationen. Mit Hilfe der Videos können wir dann die weiteren Schritte unternehmen, wie die Validierung durch externe Kooperationspartner*innen und Expert*innen. Außerdem dienen sie uns als Ankerbeispiele, um bestimmte Handlungsoptionen zu kategorisieren und einzuordnen.
Quellen:
Scorsese, M. https://www.masterclass.com/classes/martin-scorsese-teaches-filmmaking/chapters/casting-actors.
Drei Jahre hat es gedauert, bis die GEBF-Tagung wieder in Präsenz stattfinden konnte. Passend zum 10. Jubiläum lud die Gesellschaft für Empirische Bildungsforschung vom 28. Februar bis 02. März 2023 unter dem Motto „Bildung zwischen Unsicherheit und Evidenz“ zum wissenschaftlichen Austausch ein. Wir waren als Projektteam auch dabei und möchten (wie im letzten Jahr) einige Einblicke in unsere Erlebnisse schildern:
Wie schon im vergangenen Jahr auf der Nachwuchstagung erhielt Philipp in diesem Jahr auf der Haupttagung die Möglichkeit, einen Vortrag über die Pilotierung seines Performanztests für das bildungswissenschaftliche Lehramtsstudium (zur Erfassung von Beratungskompetenz) zu halten und zu diskutieren. Das Thema Performanztests und Simulationen befand sich auf der GEBF in „guter Gesellschaft“, weshalb Philipp vor allem das Symposium „Simulationsbasiertes Lernen an der Hochschule – neue Erkenntnisse aus experimentellen und metaanalytischen Studien“ begeisterte. Die vier Vorträge fokussierten die Rolle von Simulationen in der Hochschulbildung im Medizin- und Lehrkräftebereich und konnten veranschaulichen, wie gut Simulationen auch in der Lehrkräftebildung eingesetzt werden können. Zunächst präsentierte Constanze Richters eine Studie, in der die Frage untersucht wurde, ob bzw. inwiefern strukturierte Reflexion und Kollaborationsskripts den Erwerb kollaborativer Diagnosefähigkeiten in einer medizinischen Simulation unter Berücksichtigung des Vorwissens der Lernenden verbessern können. Danach folgte unter dem Titel „Lernen mit Simulationen: Eine Metaanalyse zur Adaptivität von instruktionaler Unterstützung“ ein Vortrag von Olga Chernikova, die sich in ihrer Metastudie der Umsetzung und den Voraussetzungen von Adaptivitätsstrategien von Simulationen widmet. Den Dritten Vortrag hielt Stephanie Kron. Sie berichtet von ihrer Untersuchung zur Spezifität bzw. Sensitivität von Diagnosen Mathematiklehramtsstudierender in einer simulationsbasierten Lernumgebung. Im letzten Vortrag zur „Förderung von Reanimationsskills durch simulationsbasiertes Lernen: Welche Vorteile bringt der Einsatz von first-person-view-Videos im Debriefing?“ präsentierte Martin Gartmeier die Ergebnisse seiner Forschung zu der Frage, inwieweit Videos aus der first-person-Perspektive zu Veränderungen im Debriefing und zu verbessertem Lernerfolg beitragen können.
Jana und Christoph haben auf der diesjährigen GEBF-Tagung bei dem Symposium „‚Bedrohung‘ der Testwertinterpretation durch Testmotivation? – Fragen der Validität in der Kompetenzforschung“ mitgewirkt, welches von Daniel Scholl und Christina Watson organisiert wurde. Insbesondere die Diskussion und der Austausch mit den Teilnehmenden des Symposiums waren eines der Highlights von Jana. Darüber hinaus war auch das Symposium „Simulationsbasiertes Lernen und Messen in der Mediziner:innen und Lehrer:innenausbildung“ mit Ann-Kathrin Schindler bzw. Tina Seidel als stellvertretende Chair spannend. Die zwei Beiträge, die sich auf die Lehramtsausbildung bezogen, wurden von Michael Nickl aus der COSIMA-Gruppe und von Florentine Hickethier von der Universität Jena vorgestellt. Nickl et al. konnten in ihren Analysen (zur Erfassung der Diagnosekompetenzen angehender Lehrkräfte mit Hilfe einer videobasierten Simulation) Profile von kognitiven und motivationalen Charakteristika der Diagnostizierenden identifizieren, die sich auf die Qualität des Diagnoseprozesses und die Urteilsakkuratheit auswirken. Hickethier et al. haben die Nützlichkeitsüberzeugungen und die Technologieakzeptanz von Lehramtsstudierenden aus verschiedenen Ländern hinsichtlich einer Virtual Reality Umgebung für Schüler*innen erfasst und konnten Veränderungen durch das eigene Erleben der VR-Umgebung aufzeigen (v.a. eine höhere Intention, VR auch in der eigenen Berufspraxis anzuwenden). VR war generell ein großes Thema auf der diesjährigen GEBF-Tagung – ähnlich wie das Thema ChatGPT. So beschäftigte sich bspw. das Symposium „Unterrichtserleben in Virtual Reality als Chance für die Lehrkräftebildung“ mit virtuellen Unterrichtssimulationen in VR-Umgebungen. Interessant war hier, dass im Vergleich zur Arbeit mit traditionellen Unterrichtsvideos keine empirisch signifikanten Effekte für den VR-Einsatz gefunden werden konnten (mit Bezug auf die professionelle Unterrichtswahrnehmung und Reflexionsfähigkeiten angehender Lehrkräfte).
Neben den vielen Einzelbeiträgen und Symposien waren die Keynotes der diesjährigen GEBF-Tagung weitere Highlights für Jana. Im Vortrag von Prof. Dr. Gerd Gigerenzer ging es bspw. um die Risikokompetenz und um Bildung im digitalen Zeitalter – mit der klaren Message, dass auch wir Menschen smarter werden müssen, wenn um uns herum alles smarter wird ;-). In der Keynote von Prof. Dr. Monika Waldis ging es um die hohe Bedeutung gesellschaftswissenschaftlichen Wissens insbesondere in Zeiten der Krise und in Zeiten, in denen die Demokratie weltweit unter Druck steht. Prof. Dr. Waldis sieht eine besondere Chance zur Förderung der Demokratiekompetenz (mit der Leitidee der Urteilsfindung und Fähigkeiten des Perspektivwechsels und der Empathie) in Argumentations- und Debattiertrainings als didaktische Interventionen für Schüler*innen.
Christoph lieferte in diesem Jahr zusammen mit Pascal Pollmeier und Tim Rogge einen Beitrag zum Symposium „Eigenvideografie als Professionalisierungstool für Lehramtsstudierende im Praxissemester“, das von Verena Zucker organisiert wurde. Zusammen mit Nicola Meschede berichtete sie von einer Untersuchung zur Frage, welche persönlichen Merkmale Lehramtsstudierender (z.B. Misserfolgserwartung) und Bedingungsfaktoren (z.B. zeitliche Belastung) die Bereitschaft Eigenvideografien im Praxissemester durchzuführen beeinflussen. Dies war insofern interessant, dass es auch die Frage berührt, die wir (also, Pascal, Tim und Christoph) auch in unserer Interviewstudie untersucht haben. Auch die beiden weiteren Vorträge von Robin Junker (in Vertretung für Christina Gippert) und Verena Oestermann berichteten interessante Erkenntnisse zur Wirksamkeit von Eigenvideografiearbeit zur Förderung der professionellen Unterrichtswahrnehmung von Lehramtsstudierenden. Es war also insgesamt ein rundum gelungenes Symposium. An dieser Stelle daher noch einmal ein herzlicher Dank an Verena als Organisatorin! Ein weiteres Vortragshighlight aus Christophs Sicht war der Vortrag von Șeyma Gülen, die unter dem Titel „Lehramtsstudium – Vorbereitungsdienst – Lehrkräfteberuf, oder? Empirische Ana- lysen aus dem Nationalen Bildungspanel (NEPS) zum post-universitären beruflichen Verbleib von Lehramtsabsolvent*innen“ auf Basis der umfangreichen NEPS-Daten (N = 2.941 Absolvent*innen gingen in die Untersuchungen ein) Analysen dazu vornahm, wie viele Lehramtsstudierende nach einem Studienabschluss auch wirklich als Lehrkräfte arbeiten (Spoiler: In ihren Analysen sind es 79% ;)). Diese Ergebnisse kommen zur richtigen Zeit und liefern empirisch fundierte, belastbare Daten für die Diskussion um den aktuellen Lehrkräftemangel. Zwei weitere schöne Vorträge betrafen ebenfalls etwas stärker die Themen unserer Nachwuchsforschungsgruppe. Zum einen stellte Sigrid Harendza eine spannende Untersuchung dazu vor, nach welchen Kriterien aus der arbeitsplatzbasierten Beobachtung Ausbilder*innen in praktischen Ausbildungsphasen (z.B. im praktischen Jahr in der Medizinerausbildung) angehenden Ärzt*innen bestimmte Tätigkeiten anvertrauen bzw. bis zu welchem Grad (dies kann bspw. eine Tätigkeit wie das Blut Abnehmen sein). Die empirischen Daten wurden dabei in einer Simulationsumgebung gewonnen, in der umfangreich der erste Arbeitstag in einer Klinik simuliert wurde. Zum anderen berichtete Christoph Kruse unter dem Titel „Wie beurteilen Fach- und Schulleitungen angehende Lehrer:innen im Referendariat? Erkenntnisse aus einer qualitativ-rekonstruktiven Dokumentenanalyse von schriftlichen Gutachten“ von Analysen von realen Schulleitungsgutachten, die im Rahmen der zweiten Staatsprüfung in NRW angefertigt wurden. Im Zentrum stehen dabei z.B. Fragen danach, welche Kriterien Schulleitungen an die Bewertung anlegen bzw. welche impliziten Orientierungen in den Gutachten deutlich werden. Diese Prüfungsdokumente sind wenig erforscht, sie machen allerdings einen hohen Anteil der Abschlussnote des zweiten Staatsexamens aus. Insofern freut sich Christoph schon auf die weiteren Ergebnisse.
Ein weiteres Highlight war natürlich der Gesellschaftsabend, der in der Grand Hall Zollverein® veranstaltet wurde. Wie die GEBF selbst zusammenfasst ist dieser beeindruckende Ort „[…] eine moderne Eventlocation, die auf dem Gelände der ehemaligen Kokerei Zollverein des UNESCO-Welterbes Zollverein liegt. Sie wurde am 12. September 1961 als Sauger- und Kompressorenhalle in Betrieb genommen. Nach über drei Jahrzehnten wurde sie am 30. Juni 1993 stillgelegt. Die Anlage ZOLLVEREIN® Schacht XII war die größte und modernste Steinkohleförderanlage der Welt. Seit 1998 widmet sich die Stiftung Zollverein der Erhaltung und Wiedernutzbarmachung dieses Industriedenkmals.“
Wir waren auf jeden Fall nachhaltig beeindruckt und hatten viel Vergnügen 😉
Wir freuen uns, auch in diesem Jahr dabei gewesen sein zu können, bedanken uns herzlich für die zahlreichen Vorträge, Anregungen und Diskussionen und sagen bis bald!
Vorträge:
Gartmeier, M., Soellner, N., Eiberle, M., Haseneder, R., Hinzmann, D., Schulz, C., Rath, S., & Berberat, P. (2023, 01. März). Förderung von Reanimationsskills durch simulationsbasiertes Lernen: Welche Vorteile bringt der Einsatz von first-person-view-Videos im Debriefing? 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF), Essen.
Gigerinzer, G. (2023, 28. Februar). Risikokompetenz: Bildung im digitalen Zeitalter. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF), Essen.
Gippert, C., Junker, R., Seeger, D., & Holodynski, M. (2023, 01. März). Welche Rolle spielt die Eigenvideografie bei der Förderung der professionellen Unterrichtswahrnehmung von Klassenführung im Rahmen des Praxissemesters? 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF), Essen.
Harendza, S., Kadmon, M., Berberat, P., Fincke, F., Gärtner, J., Schick, K. (2023, 28. Februar). Anvertrauen von Verantwortung auf Basis von Arbeitsplatz-basierten Beobachtungen. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF), Essen
Heitzmann N., Chernikova O., Stadler, M., Holzberger,D., Seidel, T., & Fischer, F. (2023, 01. März). Lernen mit Simulationen: Eine Metaanalyse zur Adaptivität von instruktionaler Unterstützung. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF), Essen.
Hickethier, F., Dehne, M. & Gröschner, A. (2023, 28. Februar). Wie nehmen Lehramtsstudierende eine neuartige VR-Umgebung für Schüler:innen wahr? Eine Mixed-Methods-Studie zur Veränderung von Nützlichkeitsüberzeugungen. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF), Essen.
Kron, S., Sommerhoff,D., & Ufer, S. (2023, 01. März). Entwicklung diagnostischer Kompetenz zur Dezimalbruchrechnung: Akkuratheit, Sensitivität und Spezifität von Diagnosen in einer simulationsbasierten Lernumgebung. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF), Essen.
Kruse, C. (2023, 02. März). Wie beurteilen Fach- und Schulleitungen angehende Lehrer:innen im Referendariat? Erkenntnisse aus einer qualitativ-rekonstruktiven Dokumentenanalyse von schriftlichen Gutachten. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF). Essen.
Erfassung von Diagnosekompetenzen in Simulationen: Einfluss der Charakteristika des Diagnostizierenden
Nickl, M., Sommerhoff, D., Codreanu, E., Ufer, S. & Seidel, T. (2023, 28. Februar). Erfassung von Diagnosekompetenzen in Simulationen: Einfluss der Charakteristika des Diagnostizierenden. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF). Essen.
Oestermann, V., Weyland, U., & Koschel, W. (2023, 01. März). Zur Förderung professioneller Unterrichtswahrnehmung im Praxissemester anhand von Eigen- und Fremdvideos. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF). Essen.
Pollmeier, P., Vogelsang, C., & Rogge, T. (2023, 01. März). Zwischen Angst und Vorfreude – Emotionales Erleben Lehramtsstudierender bei der Arbeit mit Eigenvideografien. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF). Essen.
Richters, C., Stadler M., Radkowitsch, A., Schmidmaier, R., Fischer, M.R., & Fischer, F. (2023, 01. März). Förderung kollaborativer Diagnosefähigkeiten für Lernende mit unterschiedlichem Vorwissen: Effekte von strukturierter Reflexion und Kollaborationsskripts in einer agentenbasierten medizinischen Simulation. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF), Essen.
Waldis, M. (2023, 01. März). Gesellschaftswissenschaftliches Lernen in Zeiten der Krise – Wissensordnungen und Kompetenzen revisited. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF), Essen.
Wotschel, P. (2023, 01. März). Beratungskompetent durchs Lehramtsstudium? Entwicklung und Erprobung eines handlungsnahen Prüfungsformates. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF), Essen.
Zucker, V., Meschede, N. (2023, 01. März). Was motiviert oder hemmt Studierende, sich im Praxissemester videografieren zu lassen? Eine Untersuchung zur Bedeutung persönlicher Voraussetzungen für die Nutzung von Eigenvideografie. 10. Jahrestagung der Gesellschaft für Bildungsforschung (GEBF). Essen.
Neben dem kostenfreien Angebot der Datenarchivierung, stellt der Verbund aber auch umfangreiche Informationen für Bildungsforscher*innen und weitere Interessierte um alle Themen zum Umgang mit empirisch gewonnenen Forschungsdaten zur Verfügung. Damit eine Archivierung für die spätere Datennutzung bspw. auch sinnvoll angelegt werden kann, sollte schon bei der Konzeption von Forschungsprojekten eine Vielzahl von Aspekten beachtet werden, die z.B. in einem Datenmanagementplan festgehalten werden sollten (Verbund FDB, 2015). Darüber hinaus muss jegliche Forschung, bei der Daten von Menschen erfasst bzw. erhoben werden, datenschutzrechtlichen und forschungsethischen Grundsätzen folgen. Dies betrifft insbesondere die so genannte informierte Einwilligung von teilnehmenden Personen (Verbund FDB, 2019).
Zu derartigen Fragen und noch einer ganzen Reihe mehr (z.B. zur Datenanonymisierung) bietet die Website des Verbundes zahlreiche Handreichungen und Hintergrundinformationen. Sehr empfehlenswert sind auch die regelmäßigen Schulungsangebote des Verbundes, an denen ich auch schon teilgenommen habe. Nicht zuletzt bietet der Podcast nun auch eine gute Möglichkeit für alle, die sich auch auf dem Weg zur oder von der Arbeit zum Umgang mit Daten fortbilden wollen (oder auch am Wochenende 😉 ).
Literatur:
Verbund Forschungsdaten Bildung (2015). Checkliste zur Erstellung eines Datenmanagementplans in der empirischen Bildungsforschung. Version 1.1. DIPF. (Online)
Verbund Forschungsdaten Bildung (2019). Checkliste zur Erstellung rechtskonformer Einwilligungserklärungen mit besonderer Berücksichtigung von Erhebungen an Schulen. Version 2.0. DIPF. (Online)
Todsünde Nr. 2: Ideologien und Visionen bestimmen schulische Reformen
In einer Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei betrachten wir, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Dieser ist der zweite Teil eines Beitrags, der sich mit der zweiten vom Autoren so bezeichneten Todünde beschäftigt. Im ersten Teil wurde die Kernthese des zugehörigen Kapitels genauer betrachtet. Da diese insbesondere am Beispiel der Einführung von Gesamtschulen im deutschen Bildungssystem konkretisiert wird, wurden anschließend theoretische und (ein paar wenige) historische Hintergründe zu Fragen der Gestaltung von gegliederten und aus Gesamtschulen bestehenden Schulsystemen dargestellt. Dieser Beitrag konzentriert sich nun auf die Ergebnisse empirischer Untersuchungen zum Schulsystem und insbesondere zur Wirkung von Gesamtschulen. Thesen aus dem Buch werden auch in diesem Teil im Konjunktiv als indirekte Rede wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll.
Grau ist alle Empirie…
Was ergaben nun diese ersten empirischen Studien zur neu eingeführten integrierten Gesamtschule? Wie bei einem solch komplexen Untersuchungsgegenstand zu erwarten, sind die Ergebnisse ebenfalls komplex und unterscheiden sich je nach untersuchtem Zielbereich, Bundesland und weiterer Faktoren (vgl. zusammenfassend Fend, 1982). Bspw. untersuchten Fend et al. (1976) mit Hilfe einer Befragung von 3750 Schüler*innen der 9. und 10. Schulstufe, 404 Lehrkräften und 548 Eltern aus Baden-Württemberg, Hessen, Hamburg und Berlin, ob im integrierten Gesamtschulsystem im Vergleich mehr Schüler*innen höhere Schulabschlüsse anstrebten oder welche Rolle Intelligenz in verschiedenen Schulsystem spielte. Grob zusammengefasst ergab sich, dass im Gesamtschulsystem mehr Schüler*innen als Abschluss ein Abitur erwarteten (40% gegenüber 23%, Fend et al., 1976, 141) und dass der Zusammenhang zwischen Intelligenz und Leistungen bzw. Leistungsstatus im Gesamtschulsystem im Vergleich niedriger ausfällt (r = .24 gegenüber r = .38, Fend et al., 1976).
Auch im Abschlussbericht der wissenschaftlichen Beratergruppe zum Gesamtschulversuch von Nordrhein-Westfalen (Kultusminister NRW, 1979) werden umfangreiche Ergebnisse zu Vergleichen zwischen Schüler*innen der beiden Schulsysteme berichtet. Allgemein zusammengefasst zeigte sich, dass bezogen auf fachliche Lernleistungen leistungsschwächere Schüler*innen (definiert anhand der Übergangsempfehlung auf eine Hauptschule) in der 6. Klasse an integrierten Gesamtschulen höhere Leistungen erzielten, als die entsprechende Gruppe im gegliederten System. Bei leistungsstärkeren Schüler*innen (Übergangsempfehlung für Realschule oder Gymnasium) sind die Ergebnisse umgekehrt. Dieses Muster ergab sich allerdings nicht mehr für Schüler*innen in der 9. Klasse, in der die Schüler*innen im gegliederten System höhere Leistungen erzielten (siehe hierzu Kultusminister NRW, 1979, 57ff.). Es wurde allerdings auch eine große Varianz zwischen Schulen innerhalb beider Systeme in den Ergebnissen und auch in den Lerngelegenheiten innerhalb der Schulen für die erfassten Fachleistungen festgestellt. Die Ergebnisse werden zudem in Beziehungen aus Hessen gesetzt, die teils umgekehrte Befunde zeigten. Im Bereich der Lehrkräfte-Schüler*innen-Verhältnisse berichteten Gesamtschüler*innen ein höheres Maß an zugestandener Mitbestimmung durch Lehrkräfte und höhere Selbstständigkeitserwartungen als im gegliederten System. Bei Verstößen gegen schulrelevante Normen (z.B. Störungen etc.) ergaben sich keine Unterschiede zwischen den Systemen. Bezogen auf schulische Abschlüsse erwarben Schüler*innen an Gesamtschulen zu geringeren Anteilen einen Hauptschulabschluss, dafür aber einen höheren Anteil der Fachoberschulreife (68% gegenüber 50%, Kultusminister NRW, 1979, 43f.). In den Oberstufen der Gesamtschulen erreichte allerdings ein geringerer Anteil an Schüler*innen das Abitur (73% gegenüber 86% an Gymnasien, Kultusminister NRW, 1979, 44f.). Es wird in diesem Zusammenhang aber auch formuliert: „Für die Bewertung der Erfolgsquote in der gymnasialen Oberstufe der Gesamtschule ist zu berücksichtigen, daß [sic!] an Gesamtschulen mehr als ein Drittel der Schüler eines Eingangsjahrgangs in die gymnasiale Oberstufe eintritt, während im traditionellen Schulsystem nur etwas mehr als ein Fünftel aller Schüler eines Eingangsjahrgangs […] in die Oberstufe übergeht.“ (Kultusminister NRW, 1979, 45).
Allein der Blick in diese zwei Publikationen zeigt für die Beurteilung der integrierten Gesamtschule: Es ist kompliziert ;). Es besteht eine große Varianz zwischen Ergebnissen verschiedener Schulen innerhalb beider Systeme, innerhalb einzelner Schulen und in den Systemen einzelner Bundesländer (es gibt also auch Überlappungen zwischen den Schulformen, also dass z.B. an bestimmten Gesamtschulen durchschnittlich höhere Leistungen erzielt wurden, als an bestimmten Realschulen oder Gymnasien). Unterschiede in den Curricula und Lerngelegenheiten erschweren zudem einen guten Vergleich. Im letztgenannten Zitat deutet sich eine Schwierigkeit an, die beim Vergleich verschiedener Schulsysteme immer wieder eine Rolle spielt: Es kommt immer darauf an, mit welchen Voraussetzungen Schüler*innen in verschiedene Schulformen übergehen. Um Gesamtschulen und gegliederte Schulsysteme gut vergleichen zu können, wäre es notwendig, dass sich Schüler*innen in den Voraussetzungen möglichst stark ähneln, weil dann Unterschiede in Lernzuwächsen auch deutlich auf das Schulsystem zurückgeführt werden können (wenn man mal davon absieht, dass es noch andere Einflüsse wie die Ausbildung von Lehrkräften etc. gibt).
Das Problem der Eingangsselektivität
Man spricht hierbei auch von der Eingangsselektivität (vgl. Pfost et al., 2010; Ditton & Krüsken, 2006), was meint, dass Schüler*innen sich schon beim Übergang von der Grundschule auf die weiterführende Schulform stark in für das Lernen relevanten Merkmalen unterscheiden. Es ist ein gut belegter Befund der empirischen Bildungsforschung, dass die schulische Leistung von Schüler*innen stark mit den von ihnen ‚mitgebrachten‘ Voraussetzungen zusammenhängen (vgl. Renkl, 2020; vgl. Maaz et al., 2007). Dies meint nicht nur die kognitiven Fähigkeiten oder das Vorwissen aus der Grundschule, sondern auch Aspekte wie den sozio-ökonomischen Status der Familie (z.B. über wieviel Geld eine Familie für weitere Bildungsausgaben verfügt, Berufstätigkeit der Eltern), das Bildungsniveau der Familie (z.B. Abschlüsse der Eltern, Zugang zu Bildungsmedien), oder der Migrationsstatus der Familie (z.B. Kenntnis der Unterrichtssprache) (vgl. Watermann & Baumert, 2006).
Die Eingangsselektivität ist im deutschen Schulsystem relativ groß und es bestehen große Unterschiede zwischen den Voraussetzungen von Schüler*innen der verschiedenen Schulformen. Man spricht in diesem Zusammenhang auch von der Komposition der Schülerschaft einer Schule oder Schulform (vgl. Baumert et al., 2006). Im IQB-Bildungstrend 2018, der aktuellsten veröffentlichten, auf deutschlandweit repräsentativen Daten für die Sekundarstufe I (bezogen auf die 9. Klasse) beruhenden Untersuchung, wurde bspw. beobachtet, dass sich die Zusammensetzung der Schülerschaft an Gymnasien und nicht-gymnasialen Schulformen stark unterscheidet. So hatte an Gymnasien im Jahr 2018 ein Anteil von MW = 27,7% (SD = 19,7%) der Schüler*innen einen Zuwanderungshintergrund (mindestens ein im Ausland geborener Elternteil), an nicht-gymnasialen Schulformen demgegenüber MW = 34,4% (SD = 25,6%) (Schipolowski et al., 2019, 148). Ebenso hatten an Gymnasien MW = 60,8% (SD = 7,4%) der Schüler*innen einen mittleren sozio-ökonomischen Status (erfasst mit dem HISEI (Highest International Socio-Economic Index of Occupational Status), vgl. Ganzeboom et al., 1992). An nicht-gymnasialen Schulformen betrug dieser Anteil MW = 42,3% (SD = 7,5%).
Seit den ersten Studien zur integrierten Gesamtschule hat sich im deutschen Schulsystem viel verändert. Ihr Anteil ist gestiegen und es wurden eine Reihe größere large-scale-assessments durchgeführt, die es ermöglichen, Unterschiede in Leistungsständen und Lernverläufen zwischen verschiedenen weiterführenden Schulformen zu betrachten. Auf Basis von Daten der BIJU-Studie (Bildungsprozesse und psychosoziale Entwicklung im Jugendalter), in der von N = 2964 Schüler*innen in der 7. und 10. Klasse mit standardisierten Tests Leistungen im Fach Mathematik und Englisch erfasst wurden, konnten bspw. Köller & Baumert (2001) feststellen, dass sich die Leistungen der Schüler*innen je nach Schulform unterschiedlich entwickeln. Am Gymnasium erreichten Lernende in Klasse 10 die höchsten Werte, lagen aber auch in Klasse 7 schon über den anderen Schulformen. Die Leistungen von Schüler*innen an integrierten Gesamtschulen lagen zwischen denen an Haupt- und Realschulen. Zugleich ergaben sich Unterschiede dahingehend, dass sich auch die Zuwächse an den Schulformen unterschieden, bspw. nahmen die Leistungen im Fach Englisch an Gymnasien auch stärker zu, als an den anderen Schulformen (Baumert et al., 2006). Ähnliche Muster konnten auch in den verschiedenen PISA-Studien beobachtet werden. Bspw. erreichten Schüler*innen an Gymnasien in der PISA-Untersuchung 2012 (N = 5001 15-jährige Schüler*innen, davon ca. 24,3% an einer Form der Gesamtschule) durchschnittlich den höchsten Wert in allen Kompetenzbereichen. Die durchschnittlichen Leistungen von Schüler*innen an Gesamtschulen lagen zwischen den Mittelwerten der Haupt- und der Realschule (z.B. Mathematik: Sälzer et al., 2013b, Naturwissenschaften: Schiepe-Tiska et al., 2013). Auch hier lag – wie schon aus älteren Untersuchungen bekannt – eine starke Varianz der Werte zwischen einzelnen Schüler*innen vor, so dass sich größere Überlappungsbereiche auch zwischen den Schulformen ergaben. In den IQB-Ländervergleichen bzw. Bildungstrends sowie in den PISA-Studien 2015 und 2018 wurden nur das Gymnasium und nicht-gymnasiale Schulformen unterschieden (vgl. hierzu auch Hurrelmann, 2013), wobei Schüler*innen an Gymnasien insgesamt häufiger höhere Kompetenzstufen erreichten (vgl. Reiss et al., 2019; vgl. Reiss et al., 2016; Kölm & Mahler, 2019; Pant et al., 2013). Der von Heinz-Peter Meidinger formulierte „beispiellose Absturz“ (Meidinger, 2021, 39) Baden-Württembergs in nationalen Schulleistungsvergleichen ab 2016 zeigt sich im IQB-Bildungstrend bspw. wie folgt. Der Anteil von Schüler*innen, die den Mindeststandard in Mathematik nicht erreicht hat, sank zwischen den Bildungstrends 2012 und 2018 um ca. 1% und der Anteil, der den Regelstandard erreichte oder übertraf stieg um ca. 2,8% (Kölm & Mahler, 2019, 163f.). Wohl sank aber der Anteil von Schüler*innen an Gymnasien, die den Optimalstandard erreichten (um ca. 5,5%, Kölm & Mahler, 2019, 166). Eine genauere Unterscheidung zwischen Schulformen ist auf Basis der veröffentlichten Daten allerdings nicht möglich.
In allen diesen Untersuchungen wird aber auch ein starker Zusammenhang zwischen Schüler*innenleistungen und dem sozio-ökonomischen, familiären Hintergrund festgestellt, wobei ein ’schwächerer‘ Hintergrund mit schwächeren Leistungen einhergeht (z.B. Mahler & Kölm, 2019; Müller & Ehmke, 2013; vgl. Maaz et al., 2007). Dieser starke Zusammenhang zwischen Voraussetzungen und Lernleistungen erschwert und der stark unterschiedliche Anteil von Schüler*innen bzgl. dieser Voraussetzungen auf unterschiedliche Schulformen erschwert den Vergleich der Wirkungen von Gesamtschulen und einem gegliederten Schulsystem. Inwiefern können Unterschiede in Lernleistungen nun hauptsächlich auf die Schulform (und bspw. damit die Zusammensetzung der Schüler*innenschaft nach Fähigkeiten) zurückgeführt werden, wenn andere Einflussfaktoren so ungleich verteilt sind? Baumert et al. (2006) haben bspw. anhand von Querschnitts-Daten der nationalen Erweiterung der ersten PISA-Studie 2000 untersucht, zu welchem Anteil Unterschiede in den Testergebnissen zur Lesekompetenz zwischen Schulen durch Unterschiede auf der individuellen (z.B. kognitive Fähigkeit, sozio-ökonomischer Status) oder auf institutionellen Ebene (z.B. Schulform, mittleres Leistungsniveau einer Klasse) erklärt werden können. Hierfür berechneten sie komplexe Mehrebenen-Regressionsmodelle. Den größten Einfluss auf individueller Ebene hatten dabei die kognitive Grundfähigkeit (positiv), falls in Deutsch nicht Familiensprache war (negativ) und wenn die Eltern über keine Berufsausbildung verfügten (negativ). Auf institutioneller Ebene hatte die mittlere kognitive Grundfähigkeit einer Klasse, aber auch sie Schulform einen signifikanten Einfluss. Unterschiede zwischen Schulen konnten dabei zum größten Teil durch konfundierte Faktoren erklärt werden, also Faktoren, die das Zusammenwirken mehrerer einzelner Variablen betrachtet (z.B. mittleres Fähigkeitsniveau, Schulform, mittleres Bildungsniveau der Eltern). Der ‚reine‘ Anteil der Schulform war eher gering (Baumert et al., 2006, S. 132). Auch hier zeigt sich, dass die Eingangsselektivität von Schulformen einen großen Einfluss darauf hat, wie Ergebnisse von Leistungsvergleichen zwischen Schulen ausfallen.
Ein Blick in noch aktuellere Analysen
Die Frage danach, ob ein gegliedertes Schulsystem gegenüber einem System aus Gesamtschulen bessere Lernleistungen erzeugt, wurde auch in noch aktuelleren Untersuchungen erneut betrachtet. Esser & Seuring (2020) analysierten, ob innerhalb der deutschen Bundesländer Schulsysteme nach ‚Schärfe‘ der Verteilung von Schüler*innen nach Leistungen bzw. Leistungsfähigkeit nach der Grundschule auf weiterführende Schulformen (operationalisiert nach der Verbindlichkeit der Übergangsempfehlung) Unterschiede hinsichtlich der Lernleistungen bestehen. Vermutet wurde auf Grundlage des komplexen MoAbiT (Model of Ability Tracking, Esser, 2016), dass innerhalb der Schulformen im Vergleich insgesamt höhere Leistungen erzielt werden und dass die Unterschiede zwischen Schüler*innen aufgrund der Voraussetzungen (z.B. sozio-ökonomischer Hintergrund) durch die Differenzierung nicht zunehmen. Grundlage bildeten Daten einer (nicht-repräsentativen) Kohorte Schüler*innen (N = 2662, 13 Bundesländer) in der National Educational Panel Study (NEPS, Blossfeld et al., 2011), deren Leistungen im Lesen und in Mathematik erfasst wurden. Grob zusammengefasst berichten die Autoren auf Basis komplexer hierarchischer Regressionsmodelle, dass ihre Annahmen zutreffen, und kognitive homogenere Schulformen einen Vorteil für die Leistungsentwicklung bilden.
Wurde nun gezeigt, dass gegliederte Schulsysteme vorteilhafter sind als Gesamtschulsysteme? Heisig & Matthewes (2022) argumentieren, dass dies nicht geschlossen werden kann, da kein Schulsystem mit Gesamtschulen mit gegliederten Systemen verglichen wurde, sondern verschiedene gegliederte Schulsysteme untereinander. Sie können allerdings auf Basis desselben Datensatzes und denselben Analysemethoden die Ergebnisse von Esser & Seuring (2020) nicht replizieren. Der Grund hierfür ist auch hier (unter anderem) wieder die Eingangsselektivität verschiedener Schulformen, deren Kontrolle in der Erststudie auch Heisig & Matthewes (2022) kritisieren. Als zentrales Maß der Fähigkeit wurden Maße der kognitiven Fähigkeit zu Beginn von Klasse 5 verwendet. Wurde aber zusätzlich kontrolliert, dass sich Grundschüler*innen in Bundesländern mit unterschiedlich ’strikten‘ Verteilungen nach Fähigkeiten auf weiterführende Schulformen schon vor dem Übergang unterscheiden, dann ließen sich die Ergebnisse von Esser & Seuring (2020) nicht mehr replizieren. Grundschüler*innen unterscheiden sich zwischen den Bundesländern stark bzgl. ihrer Kompetenzen im Lesen und in Mathematik, was auch wiederum mit dem sozio-ökonomischen Hintergrund zusammenhängt (Stanat et al., 2022). Lorenz & Lenz (2022) nutzten die repräsentativen Daten der IQB-Bildungstrends 2015 und 2018 (N = 28.625 Schüler*innen (Deutsch) bzw. 20.772 Schüler*innen (Mathematik)) und versuchten die Ergebnisse von Esser & Seuring (2020) ebenfalls zu replizieren. Sie kamen zu folgendem Ergebnis: „Allerdings unterschied sich die kognitive Homogenität nur in der Stichprobe aus dem Jahr 2015 signifikant zwischen den Systemen. Ein (scheinbar systembedingter) Leistungsvorteil in den Bundesländern mit einer strikten Leistungsdifferenzierung konnte wiederum nur für die Stichprobe aus dem Jahr 2018 und den Kompetenzbereich Mathematik festgestellt werden.“ (Lorenz & Lenz, 2022). Effekte ließen sich also nur teilweise zeigen, wobei die Mechanismen des MoAbiT nicht bestätigt werden konnten. Zusätzlich sehen Lorenz & Lenz (2022) die Tendenz, dass leistungsschwächere Schüler*innen in ’strikt‘ differenzierenden Systemen weniger von einer kognitiven Homogenisierung profitieren, und sie weisen auf die Unterschiede zwischen den Voraussetzungen in den Bundesländern hin.
Fazit
Was kann die empirische Bildungsforschung nun zur Gesamtschule sagen? Ist ein Schulsystem aus Gesamtschulen, also einer Schulform nach der Grundschule für alle Schüler*innen, einem gegliederten System überlegen? Oder ist sie in den Worten von Heinz-Peter Meidinger „umfassend und klar gescheitert“ (Meidinger, 2021, 38). Trotz vieler komplexer Analysen und umfangreicher Untersuchungenn lässt sich dies nicht pauschal mit ‚Nein‘ oder ‚Ja‘ beantworten.
Ein Grund hierfür ist eher forschungsmethodischer Natur. Um Unterschiede zwischen Schulsystemen eindeutig auf die Schulformorganisation zurückführen zu können, müssten im idealen Fall zwei Gruppen von Schüler*innen unterschieden werden, die in der Verteilung möglichst aller lernrelevanten Einflussfaktoren (z.B. kognitive Fähigkeiten, sozio-ökonomischer Hintergrund, Familiensprache) hinreichend gleich sind, sich aber nur darin unterscheiden, in was für einem schulischen System sie in ihrer Schullaufbahn unterwegs sind (und auch dann müssten die zur Verfügung stehenden Lerngelegenheiten, Ausbildung der Lehrkräfte u.v.a hinreichend ähnlich sein). Eine solche Studie bzw. eine solche Ausgangslage wird sich aber unter Realbedingungen kaum herstellen lassen. Solange Gesamtschulen neben den traditionellen Schulen des dreigliedrigen Schulsystems bestehen, wird es aufgrund vieler Gründe so gut wie immer dazu kommen, dass sich bzgl. der Voraussetzungen der Schüler*innen unterschiedliche Verteilungen in verschiedenen Schulformen ergeben und daher eine gewisse Eingangsselektivität bestehen bleiben. Das hat auch damit zu tun, dass mit unterschiedlichen Schulabschlüssen auch bei sonst vergleichbaren Lernleistungen der Schüler*innen stark unterschiedliche weitere Lebenschancen einhergehen (z.B. Schuchart, 2007) und dies den Beteiligten auch bewusst ist.
Ein anderer Grund liegt darin, dass die vorliegenden Forschungsergebnisse auch darauf hindeuten, dass es für die Förderung inhaltsbezogener Kompetenzen weniger auf die äußere strukturelle Gestaltung von Schule ankommt, sondern auf die innere Gestaltung, also darauf, was konkret mit den Schüler*innen im Unterricht gemacht wird. Anders gesagt, es hat einen größeren Effekt, wenn die konkreten Lerngelegenheiten einer konkreten Klasse möglichst qualitätsvoll sind (vgl. Gräsel & Göbel, 2022), als wenn das gesamte System einer bestimmten Struktur folgt. Das soll nicht bedeuten, dass das Schulsystem keine Rolle spielt, es existieren nur eine Menge anderer Stellschrauben, an denen ebenfalls gedreht werden könnte, um Lernleistungen zu verbessern, die nicht auf der obersten Strukturebene liegen. Oder wie Hattie (2002) es formuliert: „Good teaching can occur independently of the class configuration or homogeneity of the students within the class.“ (Hattie, 2002, 449)
Einen bestimmten, positiven Effekt hat die Einführung von Gesamtschulen bzw. die damit verbundenen Untersuchungen und Diskussionen allerdings auf jeden Fall ergeben. Durch sie wurden auch affektiv-emotionale Aspekte der Schule (z.B. Leistungsangst, Schulstress) in der empirischen Bildungsforschung stärker untersucht und insbesondere auch in anderen Schulformen in den Fokus genommen (vgl. Mattes, 2017). Die dritte Todsünde der Bildungspolitik wird Gegenstand des nächsten Beitrags in dieser Artikelreihe sein. Er wird an dieser Stelle verlinkt, sobald er online zugänglich ist.
Literatur:
Baumert, J., Stanat, P., & Watermann, R. (2006). Schulstruktur und die Entstehung differenzieller Lern- und Entwicklungsmilieus. In J. Baumert, P. Stanat, & R. Watermann, (Hrsg.), Herkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Verteilungsgerechtigkeit (S. 95-188). VS Verlag für Sozialwissenschaften. (Online)
Blossfeld, H.P., & H.G. Roßbach (Hrsg.) (2011). Education as a Lifelong Process – The German National Educational Panel Study (NEPS). Springer VS. (Online)
Ditton, H., & Krüsken, J. (2006). Der Übergang von der Grundschule in die Sekundarstufe I. Zeitschrift für Erziehungswissenschaft, 9, 348-372. (Online)
Esser, H. (2016). Bildungssysteme und ethnische Bildungsungleichheit. In C. Diehl, C. Hunkler, & C. Kristen (Hrsg.), Ethnische Ungleichheiten im Bildungsverlauf. Mechanismen, Befunde, Debatten (S. 331-396). Springer VS. (Online)
Esser, H., & Seuring, J. (2020). Kognitive Homogenisierung, schulische Leistungen und soziale Bildungsungleichheit. Zeitschrift für Soziologie, 49(5-6), 277-301. (Online)
Fend, H., Knörzer, W., Nagl, W., Specht, W., & Väth-Szusdziara, R. (1976). Gesamtschule und dreigliedriges Schulsystem.Eine Vergleichsstudie über Chancengleichheit und Durchlässigkeit. Klett Verlag.
Fend, H. (1982). Gesamtschule im Vergleich. Bilanz der Ergebnisse des Gesamtschulversuchs. Beltz.
Ganzeboom, H. B., De Graaf, P. M., & Treiman, D. J. (1992). A standard international socio-economic index of occupational status. Social Science Research, 21(1), 1-56. (Online)
Gräsel, C., & Göbel, K. (2022). Unterrichtsqualität. In H. Reinders, D. Bergs-Winkels, A. Prochnow, & I. Post (Hrsg.), Empirische Bildungsforschung (S.663-674). Springer VS. (Online)
Hattie, J. A. (2002). Classroom composition and peer effects. International Journal of Educational Research, 37(5), 449-481. (Online)
Heisig, J. P., Elbers, B., & Solga, H. (2020). Cross-national differences in social background effects on educational attainment and achievement: absolute vs. relative inequalities and the role of education systems. Compare: A Journal of Comparative and International Education, 50(2), 165-184. (Online)
Heisig, J. P., & Matthewes, S. H. (2022). No Evidence that Strict Educational Tracking Improves Student Performance through Classroom Homogeneity: A Critical Reanalysis of Esser and Seuring (2020). Zeitschrift für Soziologie, 51(1), 99-111. (Online)
Köller, O., & Baumert, J. (2001). Leistungsgruppierungen in der Sekundarstufe I. Ihre Konsequenzen für die Mathematikleistung und das mathematische Selbstkonzept der Begabung. Zeitschrift für Pädagogische Psychologie, 15(2), 99-110. (Online)
Kölm, J., & Mahler, N. (2019). Kompetenzstufenbesetzungen im Ländervergleich. In P. Stanat, S. Schipolowski, N. Mahler, S. Weirich, & S. Henschel. (Hrsg.), (2019). IQB-Bildungstrend 2018. Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I im zweiten Ländervergleich (S. 157-200). Waxmann. (Online)
Kultusminister des Landes NRW (Hrsg.) (1979). Gesamtschule in Nordrhein-Westfalen – Ergebnisberichte. Grevenverlag.
Lorenz, G., & Lenz, S. (2022). Vorteile Kognitiver Homogenisierung? Replikation einer Studie von Hartmut Esser und Julian Seuring zu den Auswirkungen von atrikter Leistungsdifferenzierung auf Schulleistungen und Bildungsungleichheit. Preprint. (Online)
Maaz, K., Watermann, R., & Baumert, J. (2007). Familiärer Hintergrund, Kompetenzentwicklung und Selektionsentscheidungen in gegliederten Schulsystemen im internationalen Vergleich. Eine vertiefende Analyse von PISA Daten. Zeitschrift für Pädagogik, 53(4), 444-461. (Online)
Mahler, N., & Kölm, J. (2019). Soziale Disparitäten. In P. Stanat, S. Schipolowski, N. Mahler, S. Weirich, & S. Henschel. (Hrsg.), (2019). IQB-Bildungstrend 2018. Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I im zweiten Ländervergleich (S. 265-294). Waxmann. (Online)
Mattes, M. (2017). Von der Leistungs- zur Wohlfühlschule? Die Gesamtschule als Gegenstand gesellschaftlicher Debatten und pädagogischer Wissensproduktion in der Bundesrepublik Deutschland in den 1970er und 1980er Jahren. In S., Rehm E. Glaser, B. Behm, & T. Drope (Hrsg.), Wissen machen. Beiträge zu einer Geschichte erziehungswissenschaftlichen Wissens in Deutschland zwischen 1945 und 1990. Zeitschrift für Pädagogik – 63. Beiheft (S. 187-206). Beltz Juventa. (Online)
Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
Müller, K., & Ehmke, T. (2013). Soziale Herkunft als Bedingung der Kompetenzentwicklung. In M. Prenzel, C. Sälzer, E. Klieme, & O. Köller (Hrsg.), PISA 2012 – Fortschritte und Herausforderungen in Deutschland (S. 245-274). Waxmann. (Online)
Pand, H-A., Stanat, P., Pöhlmann, C., Hecht, M., […], & Ziemke, A. (2013). Der Blick in die Länder. In H-A. Pand, P. Stanat, U. Schroeders, A. Roppelt, T. Siegle, & C. Pöhlmann (Hrsg.), IQB-Ländervergleich 2012 – Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I (S. 159-247). Waxmann.
Pfost, M., Karing, C., Lorenz, C., & Artelt, C. (2010). Schereneffekte im ein-und mehrgliedrigen Schulsystem. Zeitschrift für Pädagogische Psychologie, 24, 258-272. (Online)
Reiss, K., Sälzer, C., Schiepe-Tiska, Klieme, E., & Köller, O. (Hrsg.) (2016). PISA 2015 – Eine Studie zwischen Kontinuität und Innovation. Waxmann. (Online)
Reiss, K., Weis, M., Klieme, E., & Köller, O. (Hrsg.) (2019). PISA 2018 – Grundbildung im internationalen Vergleich. Waxmann. (Online)
Renkl, A. (2020). Wissenserwerb. In E. Wild, & J. Möller (Hrsg.), Pädagogische Psychologie (S. 3-24). Springer. (Online)
Roller, M., & Steinberg, D. (2020). The distributional effects of early school stratification-non-parametric evidence from Germany. European Economic Review, 125, 103422. (Online)
Sälzer, C., Reiss, K., Schiepe-Tiska, Prezel, M., & Heinze, A. (2013b). Zwischen Grundlagenwissen und Anwendungsbezug: Mathematische Kompetenz im internationalen Vergleich. In M. Prenzel, C. Sälzer, E. Klieme, & O. Köller (Hrsg.), PISA 2012 – Fortschritte und Herausforderungen in Deutschland (S. 47-98). Waxmann. (Online)
Schiepe-Tiska, A., Schöps, K., Rönnebeck, S., Köller, O., & Prenzel, M. (2013). Naturwissenschaftliche Kompetenz in PISA 2012: Ergebnisse und Herausforderungen. In M. Prenzel, C. Sälzer, E. Klieme, & O. Köller (Hrsg.), PISA 2012 – Fortschritte und Herausforderungen in Deutschland (S. 189-216). Waxmann. (Online)
Schipolowski, S., Stanat, P., Mahler, N., & Lenz, S. (2019). Kontextinformationen zu den Schulsystemen der Länder in der Sekundarstufe I. In P. Stanat, S. Schipolowski, N. Mahler, S. Weirich, & S. Henschel. (Hrsg.), (2019). IQB-Bildungstrend 2018. Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I im zweiten Ländervergleich (S. 131-156). Waxmann. (Online)
Schuchart, C. (2007). Schulabschluss und Ausbildungsberuf: Zur Bedeutung der schulartbezogenen Bildungsbiografie. Zeitschrift für Erziehungswissenschaft, 10, 381-398. (Online)
Stanat, P., Schipolowski, S., Schneider, R., Sachse, K-A., Weirich, S., & Henschel, S. (Hrsg.) IQB-Bildungstrend 2021. Kompetenzen in den Fächern Deutsch und Mathematik am Ende der 4. Jahrgangsstufe im dritten Ländervergeleich. Waxmann. (Online)
Tillmann, K.-J. (2012). Das Sekundarschulsystem auf dem Weg in die Zweigliedrigkeit. Pädagogik, 64(5), 8-12. (Online)
Watermann, R., & Baumert, J. (2006). Entwicklung eines Strukturmodells zum Zusammenhang zwischen sozialer Herkunft und fachlichen und überfachlichen Kompetenzen: Befunde national und international vergleichender Analysen. In J. Baumert, P. Stanat, & R. Watermann, (Hrsg.), Herkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Verteilungsgerechtigkeit (S. 61-94). VS Verlag für Sozialwissenschaften. (Online)
Todsünde Nr. 2: Ideologien und Visionen bestimmen schulische Reformen
In einer Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei betrachten wir, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Nachdem wir im vorherigen Beitrag die erste der vom Autoren so bezeichneten „zehn Todsünden der Schulpolitik“ betrachtet haben, folgt in diesen Beitrag die zweite. Für die weiteren Ausführungen ist eine Kenntnis des entsprechen Buchkapitels hilfreich, weshalb es empfehlenswert ist, es zuvor zu lesen. Thesen aus dem Buch werden im Konjunktiv als indirekte Rede wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll. Es ist ein relativ langer Text geworden, was im Wesentlichen an der Komplexität des im Kapitel behandelten Themas liegt. Daher wurde er für das Blog in zwei Beiträge aufgeteilt.
Todsünde Nr. 2 bzw. die Kernthese dieses Kapitels lässt sich dahingehend zusammenfassen, dass viele bildungspolitische Entscheidungen nicht zur Lösung konkreter Sachfragen oder Probleme, sondern aufgrund von, aus Sicht des Autoren, fragwürdiger ideologischer Zielvorstellungen getroffen würden. Er kritisiert, dass aus dieser Perspektive „Schulpolitik der Realisierung einer Utopie zu dienen hat, in erster Linie also Mittel zum Zweck ist, […] um eine vermeintlich bessere Gesellschaft durchzusetzen“ (Meidinger, 2021, 34). Aus diesem ideologisch geprägten Umgang mit bildungspolitischen Fragen, folgen aus Sicht des Autors vier negative Konsequenzen.
Bei Bildungsfragen ginge es nicht um korrekte oder falsche Sachentscheidungen, sondern darum, „[…] ob man auf der Seite des Guten […] steht oder nicht.“ (Meidinger, 2021, 35)
Diskussionen über Schulthemen verliefen zunehmend emotionalisiert und in Freund-Feind-Schemata.
Es bestünde zwischen verschiedenen Beteiligten keine für die Arbeit in und an Schule wichtige Kompromissfähigkeit mehr.
Alle Beteiligten interpretierten die Ergebnisse von Bildungsstudien so, dass es die eigene Sicht auf bildungspolitische Entscheidungen stützte.
„Eine Schule für alle“ als Beispiel ideologischer Bildungsreformen
Heinz-Peter Meidinger erläutert seine Kernthese aus diesem Abschnitt an der Frage nach der strukturellen Organisation von Schule, noch konkreter an „[…] einem heftigen bis heute andauernden Kampf um Schulstrukturen, insbesondere die Ersetzung des gegliederten Schulwesens durch Gesamtschulen“ (Meidinger, 2021, 34). Er bezieht sich auf die Diskussionen zur Einführung von Gesamtschulen in den 1970er Jahren und beschreibt anschließend die Einführung von Gemeinschaftsschulen (grob: Zusammenführung von Haupt- und Realschulen) in Baden-Württemberg im Jahr 2011 als ideologisch motiviert. Diese Einführung (in Verbindung mit z.B. dem Wegfall verbindlicher Übergangsempfehlungen) habe zu einer Verschlechterung von Lernerfolgen in nationalen Schulleistungsvergleichen ab dem Jahr 2016 geführt. Als positiv wird beurteilt, dass die im selben Zeitraum in Hamburg diskutierte Verlängerung der Grundschulzeit um zwei Jahre, eingeordnet als ebenfalls ideologisch motivierte Einführung einer Art Einheitsschule, nicht umgesetzt wurde. Danach habe man in Hamburg die „wirklichen Problemfelder“ (Meidinger, 2021, 42) angegangen (z.B. mangelnde Lernerfolge). Als ähnlich ideologisch motivierte Überlegungen wird in diesem Kapitel ebenfalls die Inklusion von Schüler*innen mit Förderbedarfen in Regelschulen (verbunden mit Schließungen von Förderschulen) beschrieben. Demgegenüber wird an mehreren Stellen des Kapitels mehr oder weniger explizit gefordert, sich bei Änderungen an der Schulstruktur stärker an empirischer Evidenz zu orientieren (z.B. Meidinger, 2021, 34 oder 49).
Zusammengefasst lässt sich festhalten, dass Heinz-Peter Meidinger sich für ein Beibehalten einer mehrgliedrigen Schulstruktur ausspricht bzw. diese nicht durch ein System aus Gesamtschulen zu ersetzen. Zentrale Prämisse hierfür ist die im folgenden Zitat ausgedrückte Bewertung der Gesamtschule:
„Gemessen am eigenen Anspruch ist in Deutschland kaum ein Schulmodell so umfassend und klar gescheitert wie die Gesamt- oder Gemeinschaftsschule. Sie hat weder zu besseren Leistungen, noch zu mehr Bildungsgerechtigkeit, noch zu den erhofften höheren sozialen Kompetenzen geführt.“
(Meidinger, 2021, 38)
Umgekehrt folgt aus diesem Urteil, dass das bestehende Schulsystem mit mehreren Schularten bessere Wirkungen als ein System bestehend aus Gesamtschulen hat bzw. zumindest keine schlechteren. Wobei dies eine Interpretation meinerseits ist und von Heinz-Peter Meidinger im Kapitel nicht so explizit formuliert wird.
Aufbau von Schulsystemen
Die Auswirkung verschieden strukturierter Schulsysteme zu untersuchen, erfordert Forschungsprojekte, die – bezogen auf das Forschungsdesign, die notwendigen Datenerhebungen und die Auswertemethoden – sehr komplex und aufwendig sind. In diesem Blogbeitrag kann daher kein umfassender Einblick gegeben werden, aber ich werde versuchen, einen hinreichenden Überblick zu geben, sodass die oben formulierte Prämisse im Licht der empirischen Bildungsforschung zumindest grob eingeschätzt werden kann. Die Inklusion von Schüler*innen mit Förderbedarfen in Regelschulen wird dabei ausgeklammert (auch weil hierzu die vorliegende Datenlage im Vergleich weniger umfangreich ist).
Es geht im Kern um die Frage, wie ein Schulsystem gestaltet werden sollte, damit die mit der Schule verbundenen Ziele (insbesondere der Aufbau fachlicher oder sozialer Kompetenzen von Schüler*innen) möglichst optimal erreicht werden. In der englischsprachigen Literatur wird in diesem Zusammenhang von explicit tracking oder between-school tracking (vgl. Chmielewski, 2014) gesprochen, also der Aufteilung von Schüler*innen auf verschiedene Schulformen nach bestimmten Kriterien (z.B. nach Fähigkeiten, ability tracking). Implicit tracking oder within-school tracking bezeichnet hingegen die Aufteilung auf z.B. Kurse unterschiedlicher Fähigkeitsniveaus innerhalb einer Schulform, in Deutschland bspw. die Unterscheidung zwischen Grund- und Leistungskursen in der Oberstufe. Die Unterscheidung zwischen Gesamtschulsystemen und differenzierenden Schulsystemen ist allerdings etwas pauschal, da in den meisten Ländern das System in verschiedene Schularten gegliedert ist (Eurydice, 2022; vgl. Klieme et al., 2007). Wesentliche Unterschiede bestehen aber darin, ab welchem Alter sich Schüler*innen auf leistungsdifferenzierende Schulformen aufteilen (vgl. Sälzer et al., 2013a). In Deutschland erfolgt dies im Alter von zehn Jahren und damit im internationalen Vergleich eher früh (vgl. Klieme et al., 2007). Die Grundschule ist in allen Ländern eine Form der Gesamtschule, die von den meisten Schüler*innen besucht wird. Insofern geht es bei der Unterscheidung zwischen Gesamtschul- und gegliederten Systemen primär um weiterführende Schulen.
In Deutschland existieren neben den klassischen Schulformen des dreigliedrigen Schulsystems (Hauptschule, Realschule, Gymmasium) verschiedene Formen der Gesamtschule. Zum einen die integrierte Gesamtschule, die einem integrierten Stufenaufbau folgt, also einer nicht differenzierenden Sekundarstufe I und einer angeschlossenen Oberstufe bzw. Sekundarstufe II innerhalb einer Schule. Diese Form der Gesamtschule ist es, die wie oben erwähnt in den 1970er Jahren diskutiert wurde. Zum anderen existieren auch – in der Sprache des Statistischen Bundesamts (Destatis, 2022) – Schulen mit mehreren Bildungsgängen. Dabei handelt es sich um Schulen der Sekundarstufe I mit innerer Differenzierung, in der Schüler*innen verschiedene Abschlüsse erwerben können. Es sind also Schulen, die grob beschrieben aus einer Zusammenführung von Haupt- und Realschulen gebildet wurden (in Nordrhein-Westfalen bspw. Sekundarschulen genannt) und zusammen mit dem Gymnasium eine Art Schulsystem mit zwei Wegen bilden (vgl. Hurrelmann, 2013). Heinz-Peter Meidinger bezieht sich in seinem Kapitel auf beide Arten, wobei er beide in seine negative Beurteilung der Gesamtschule einschließt. Die von ihm auch beschriebene Verlängerung der Grundschule wird als schulartunabhängige Orientierungsstufe bezeichnet und ist keine Gesamtschule im Sinne der anderen beiden Schularten.
Wie groß ist der Anteil von Gesamtschulen im deutschen Bildungssystem? Im Schuljahr 2021/2022 gab es in Deutschland insgesamt 4058 Gesamtschulen (2156 integrierte Gesamtschulen, 1902 Schularten mit mehreren Bildungsgängen) (Destatis, 2022). Bezogen auf alle allgemeinbildenden, weiterführenden Schulen entspricht das ca. 28% , wobei die meisten von ihnen in Nordrhein-Westfalen und Baden-Württemberg, die wenigsten in Bayern liegen.
Was lässt sich theoretisch erwarten?
Warum sollte man in einem eingliedrigen oder mehrgliedrigen Schulsystem eigentlich höhere Lernzuwächse im Vergleich zum jeweils anderen System erwarten? Fokussiert man sich rein auf die Entwicklung inhaltsbezogener Kompetenzen (z.B. Lesekompetenz, mathematische Kompetenz), dann werden auf theoretischer Basis grundsätzlich die folgenden Begründungsmuster für Vorteile des jeweiligen Systems formuliert.
Befürworter*innen eines Schulsystems, in dem die Schüler*innen nach der Grundschule nach ihrer Leistung bzw. (kognitiven) Leistungsfähigkeit auf verschiedene Schulformen verteilt werden, argumentieren meist dahingehend, dass eine möglichst homogene Zusammensetzung nach Fähigkeiten Vorteile für die Gestaltung des Unterrichts bietet (vgl. Hallinan, 1994). Sind diese auf einem möglichst ähnlichen Niveau, könnten Lehrkräfte ihren Unterricht einfacher und kohärenter an deren Lernvoraussetzungen anpassen und besser an die Voraussetzungen angepasster Unterricht führt zu besseren Lernzuwächsen. In einem so differenzierten System sollte es also dazu kommen, dass Schüler*innen in verschiedenen, nach Leistungsfähigkeit homogenen Schulformen insgesamt besser gefördert würden, was insgesamt zu höheren Zuwächsen führen sollte (z.B. Esser, 2016). Befürworter*innen von einem Gesamtschulsystem argumentieren demgegenüber meist dahingehend, dass sich ein gegliedertes Schulsystem auf Schüler*innen mit geringeren Fähigkeitsvoraussetzungen besonders nachteilig auswirkt, weil bspw. eine Klassenzusammensetzung nur aus Schüler*innen mit schwächeren Voraussetzungen generell effektiven Unterricht erschwert, in solchen Klassen weniger kognitiv anspruchsvoll unterrichtet wird, sodass Zuwächse geringer ausfallen, und es in solchen Klassen an Unterstützung und positiven Leistungsvorbildern von Mitschüler*innen mit besseren Voraussetzungen fehlt (vgl. Heisig & Matthewes, 2022; vgl. Pfeffer, 2015). Außerdem kann das Stigma, auf einer „schlechteren“ Schulform zu sein, das Selbstkonzept (Möller & Köller, 2004) der Schüler*innen negativ formen, was Lernprozesse ebenfalls negativ beeinflusst. Diese Effekte sollten insgesamt sogar dazu führen, dass Unterschiede zwischen den Schüler*innen zunehmen (vgl. Roller & Steinberg, 2020). Dies führe zu einer größeren Bildungsungleichheit zwischen den Schüler*innen.
Je nachdem, welcher theoretischen Argumentation man eher folgt, desto eher befürwortet man die Gestaltung eines Schulsystems mit oder ohne starker externer Differenzierung in Schulformen nach Fähigkeiten. Anzumerken ist allerdings, dass mit Gesamtschulen auch noch weitere Ziele verfolgt werden bzw. bei ihrer Einführung verfolgt wurden, als die Förderung von inhaltsbezogenen Kompetenzen. Diese wurden teilweise auch als bedeutender eingeschätzt, bspw. eine bessere Einbindung von Schüler*innen bei schulischen Belangen (im Sinne von Demokratieförderung, vgl. Klafki, 2021) oder das Ermöglichen höherer Schulabschlüsse für mehr Schüler*innen mit schwächeren sozio-ökonomischen Hintergründen im Sinne von Chancengleichheit (vgl. Wulf, 2014; Hurrelmann, 2013; Fend et al., 1976).
Aller Anfang ist schwierig…
Wie lässt sich nun die Frage klären, welche Gestaltung der Schulstruktur zu positiveren Auswirkungen führt? Dies erfordert einen empirischen Vergleich zwischen Lernverläufen von Schüler*innen in Schulen unterschiedlicher Struktur bzw. aus unterschiedlichen Systemen, und das über längere Zeiträume hinweg; alles unter Berücksichtigung des gesamten jeweiligen nationalen Kontextes. Dies ist zunächst schwierig ist, da sich in Deutschland weiterführende Schulen relativ von Beginn an zu einem dreigliedrigen System entwickelt haben (vgl. Tillmann, 2012). Gesamtschulen wurden daher in den 1970er Jahren zunächst als einzelne Versuchsschulen „geschaffen“, die parallel zum laufenden Betrieb des mehrgliedrigen Systems ihre Arbeit aufnahmen. Nun geschah dies alles schon vor meiner Geburt, sodass ich mich selbst nur auf vorliegende, schriftliche Quellen stützen kann.
Die (mögliche) Einführung dieser ersten integrierten Gesamtschulen war aber auch in den Augen der damals Beteiligten schon stark durch emotionalisierte Freund-Feind-Debatten zwischen Vertreter*innen verschiedener politischer Positionen begleitet (vgl. Mattes, 2017; Hurrelmann, 2013; vgl. Tillmann, 2012). Ebenfalls wurden für die ersten Gesamtschulen schon früh umfangreiche empirische Ergebnisse (gemessen am damaligen Stand der Technik) vorgelegt (z.B. Fend, 1982). Lukesch (1985) konstatierte aber ebenfalls schon damals: „Daß [sic!] darüber hinausgehend die parteipolitische Vermarktung dieser Ergebnisse zu einer einseitigen und bisweilen verzerrenden Karikatur ausartete, war eine weitere leidvolle Erfahrung für die solchermaßen instrumentalisierten Forscher“ (Lukesch, 1985, 525). Die Sicht von Heinz-Peter Meidinger auf diese Zeit entspricht also auch der Sicht der damaligen Protagonist*innen (vgl. Meidinger, 2021, 34ff.).
Welche Ergebnisse diese ersten Untersuchungen erbrachten, ist Gegenstand des zweiten Teils dieses Beitrags. In diesem werden auch die Ergebnisse aktueller Studien zur Frage der Differenzierung im Schulsystem berichtet. Er findet sich hier.
Literatur:
Chmielewski, A. K. (2014). An international comparison of achievement inequality in within-and between-school tracking systems. American Journal of Education, 120(3), 293-324. (Online)
Esser, H. (2016). Bildungssysteme und ethnische Bildungsungleichheit. In C. Diehl, C. Hunkler, & C. Kristen (Hrsg.), Ethnische Ungleichheiten im Bildungsverlauf. Mechanismen, Befunde, Debatten (S. 331-396). Springer VS. (Online)
European Commission/EACEA/Eurydice (2022). The structure of the European education systems 2022/2023: schematic diagrams. Eurydice Facts and Figures. Publications Office of the European Union. (Online)
Fend, H., Knörzer, W., Nagl, W., Specht, W., & Väth-Szusdziara, R. (1976). Gesamtschule und dreigliedriges Schulsystem.Eine Vergleichsstudie über Chancengleichheit und Durchlässigkeit. Klett Verlag.
Fend, H. (1982). Gesamtschule im Vergleich. Bilanz der Ergebnisse des Gesamtschulversuchs. Beltz.
Hallinan, M.T. (1994). Tracking: From theory to practice. Sociology of Education, 67, 79–84. (Online)
Heisig, J. P., & Matthewes, S. H. (2022). No Evidence that Strict Educational Tracking Improves Student Performance through Classroom Homogeneity: A Critical Reanalysis of Esser and Seuring (2020). Zeitschrift für Soziologie, 51(1), 99-111. (Online)
Klafki, W. (2021). Integrierte Gesamtschule – Ein notwendiger Schulversuch. In W. Klafki W. (Herausgegeben von K-H. Braun, F. Stübig, & H. Stübig), Schulreformen und Bildungspolitik in der Bundesrepublik Deutschland (S. 127-186). Springer. (Online)
Klieme, E., Döbert, H., van Ackeren, I., Bos, W., Klemm, K., […] & Weiß, M. (2007). Vertiefender Vergleich der Schulsysteme ausgewählter PISA-Teilnehmerstaaten: Kanada, England, Finnland, Frankreich, Niederlande, Schweden. Bundesministerium für Bildung und Forschung. (Online)
Mattes, M. (2017). Von der Leistungs- zur Wohlfühlschule? Die Gesamtschule als Gegenstand gesellschaftlicher Debatten und pädagogischer Wissensproduktion in der Bundesrepublik Deutschland in den 1970er und 1980er Jahren. In S., Rehm E. Glaser, B. Behm, & T. Drope (Hrsg.), Wissen machen. Beiträge zu einer Geschichte erziehungswissenschaftlichen Wissens in Deutschland zwischen 1945 und 1990. Zeitschrift für Pädagogik – 63. Beiheft (S. 187-206). Beltz Juventa. (Online)
Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
Möller, J. & Köller, O. (2004). Die Genese akademischer Selbstkonzepte: Effekte dimensionaler und sozialer Vergleiche. Psychologische Rundschau, 55, 19–27. (Online)
Pfeffer, F. T. (2015). Equality and quality in education. A comparative study of 19 countries. Social Science Research, 51, 350-368. (Online)
Roller, M., & Steinberg, D. (2020). The distributional effects of early school stratification-non-parametric evidence from Germany. European Economic Review, 125, 103422. (Online)
Sälzer, C., Prenzel, M., & Klieme, E. (2013a). Schulische Rahmenbedingungen der Kompetenzentwicklung. In M. Prenzel, C. Sälzer, E. Klieme, & O. Köller (Hrsg.), PISA 2012 – Fortschritte und Herausforderungen in Deutschland (S. 155-188). Waxmann. (Online)
Tillmann, K.-J. (2012). Das Sekundarschulsystem auf dem Weg in die Zweigliedrigkeit. Pädagogik, 64(5), 8-12. (Online)
Wulf, K. (2014). Integrierte Gesamtschule: Geschichte-Konzept-Vergleich. disserta Verlag.
In einer Beitragsreihe beschäftigen wir uns mit dem Täuschen und Betrügen im Studium, also allgemeiner gesprochen mit akademischem Fehlverhalten von Studierenden. Dabei schauen wir insbesondere, welche Ergebnisse aus Untersuchungen der empirischen Bildungsforschung hierzu vorliegen. Im Detail ging es bisher darum wie man Fehlverhalten erfassen kann (Teil 2), in welchem Ausmaß es auftritt (Teil 3), welche möglichen Ursachen es gibt (Teil 4) und mit welchen Maßnahmen man ihm begegnen kann (Teil 5). In diesem vorletzten Beitrag kehren wir ganz zurück an den Beginn (Teil 1) bzw. zu dem Fall, der der Auslöser dafür war, akademisches Fehlverhalten bei Prüfungen im Blog genauer unter die Lupe zu nehmen.
Bildnachweis: stevenpb, Pixabay-Lizenz
Noten gegen Geld
Im Oktober 2021 wurde berichtet, dass eine Mitarbeiterin des zentralen Prüfungsamtes an der Universität Duisburg-Essen von Studierenden Geld angenommen habe und dafür deren Noten in der in der zentralen Prüfungsdatenbank verändert habe, auf der die Abschlusszeugnisse basieren (Olbrisch, 2021). Dabei wurden als Beispielpreise 50 Euro für die Erhöhung einer Notenstufe um 0,3 oder 800 Euro für das Eintragen einer bestandenen Klausur verlangt. Auch wenn dieser Fall natürlich in Zusammenhang mit Prüfungen steht, unterscheidet er sich doch stärker von den Formen des akademischen Fehlverhaltens, die wir bisher thematisiert haben (z.B. das „Spicken“ in Klausuren, Plagiate etc.). Hier wurde nicht in der Prüfung selbst getäuscht, sondern erst im Nachgang und zudem agieren zwei Personen gemeinsam. Sowohl die*der jeweilige Studierende, als auch die Mitarbeiterin. Dabei fand eine Geldtransaktion statt, also eine Bestechung. Auch wenn dies natürlich eine Form akademischen Fehlverhaltens ist, können solche Fälle eher unter dem Begriff der akademischen Korruption beschrieben werden.
Korrupt ist, wer Korruptes tut
Zur Frage, was genau alles unter Korruption zu fassen ist, können verschiedene Definitionen herangezogen werden, die sich je nach Kontext auch unterscheiden können (vgl. Farrales, 2005). Die Definition des BKA bezieht sich bspw. „nur“ auf das Verhalten von Personen mit öffentlichen Ämtern, mit politischen Mandaten oder Funktionsträger*innen in der Wirtschaft (Quelle). Die Organisation Transparency International arbeitet mit folgender allgemeiner Definition:
„Korruption ist der Missbrauch anvertrauter Macht zum privaten Nutzen oder Vorteil.“
(Transparency International, 2022)
Rumyantseva (2005) unterscheidet für den Kontext von Hochschulen zwei grundsätzliche Typen von Korruption: „corruption that involves students as agents and has direct affect on their values, beliefs, and life chances, and corruption that does not involve students as agents and has limited direct affect on them.“ (Rumyantseva, 2005, 86). Das obige Fallbeispiel ist dabei ein Prototyp für ersteres (also: Geld gegen Note). Zweiteres meint z.B. das Veruntreuen von Geldern, die einer Hochschule zur Verfügung gestellt werden. Dies hat natürlich auch mittelbar negative Auswirkungen auf Studierende (z.B. wenn deshalb weniger Lehrveranstaltungen angeboten werden können), aber die Studierenden selbst müssen keine bzw. müssen sich nicht entscheiden eine korrupte Handlung zu begehen. Nur Korruptionshandlungen, in denen Studierende selbst handeln, werden von Rumyantseva (2005) als „education-specific corruption“ (Rumyantseva, 2005, 88) bezeichnet. Sie formuliert in einer Taxonomie drei Formen der Korruption, die davon abhängen, mit wem die Studierenden dabei interagieren
Studierenden-Dozierenden-Interaktion: Dies beinhaltet Fälle, in denen Lehrende involviert sind, also z.B. das Geben guter Noten gegen Geld durch Professor*innen oder den Verkauf von Klausurlösungen durch Dozierende
Studierenden-Verwaltung-Interaktion: Dies meint Fälle, in denen Mitarbeitende der Hochschulverwaltung in der Korruption in involviert sind, also z.B. die Annahme von Geld, damit eine Person garantiert einen Studienplatz bekommt, das Verlangen von Geld, vom Verwaltungsvorgänge überhaupt durchzuführen, oder das Ändern von Noten durch Mitarbeitende in der Prüfungsverwaltung (wie im obigen Beispiel).
Studierenden-Service-Interaktion: Dies umfasst Fälle, in denen Mitarbeitende von zentralen Serviceeinrichtungen einer Hochschule die Korruptionspartner*innen sind, also z.B. wenn Bibliotheksmitarbeitende Gebühren für Bücher erheben, die eigentlich kostenfrei zugänglich sind.
Konkrete Fälle können nicht immer trennscharf einer der Kategorien zugeordnet werden, aber sie sind eine gute Heuristik, um mögliche Korruptionshandlungen zu beschreiben. Viele Korruptionshandlungen haben dabei einen (un-)mittelbaren Bezug zu Prüfungen. Anzumerken ist auch, dass Bestechung nicht immer monetär, also mit direkten Geldzahlungen, erfolgen muss, sondern damit auch das Annehmen von Geschenken oder sonstigen Diensten gemeint ist.
Bereitschaften zur Korruption
Empirische Untersuchungen zur Erfassung akademischer Korruption unterliegen dabei ähnlichen Schwierigkeiten wie Untersuchungen zu anderen Formen akademischen Fehlverhaltens (siehe hierzu unseren zweiten Teil). Es kann sogar vermutet werden, dass es für Korruptionshandlungen noch schwieriger ist, valide Daten zu erhalten, weil es für alle Beteiligten natürlich noch riskanter ist, wenn derartiges Verhalten aufgedeckt oder zugegeben wird. Dies könnte auch ein Grund sein, warum zur akademischen Korruption im Vergleich zu anderen Formen akademischen Fehlverhaltens weniger empirische Untersuchungen vorliegen. Ergebnisse sind zudem um stark abhängig vom jeweiligen nationalen Hochschulkontext, in dem diese durchgeführt wurden (vgl. Osipian, 2008). Viele Untersuchungen beziehen sich dabei auf Staaten der ehemaligen Sowjetunion (z.B. Karimli, 2022; Temple & Petrov, 2004), wenige Studien auf den anglo-amerikanischen Raum (z.B. Kresse, 2017). Analysen aus dem deutschsprachigen Raum hingegen sind selten. Nichtdestotrotz kann an dieser Stelle eine kleine Übersicht zu verschiedenen untersuchten Aspekten von akademischer Korruption gegeben werden.
Generell ist es schwierig, dass Ausmaß akademischer Korruption abzuschätzen. In einer Befragung von N = 260 (wobei hier im Artikel die Zahl nicht ganz klar wird) Studierenden aus Aserbaidschan bspw. gaben 67,3% in direkter Befragung an, schon einmal eine*n Dozierenden oder die Verwaltung bestochen zu haben (Sandigov, 2014). Dabei gaben zudem 70% der Studierenden an, in den letzten zwölf Monaten „demands for bribes from professors/educators at least once“ (Sandigov, 2014, 51) erlebt zu haben, und 81.5% wie Mitstudierende Dozierenden mindestens einmal eine Bestechung angeboten haben (47,3% berichten, dass sie es ständig beobachteten). Shaw et al. (2015) berichten auf Basis einer Befragung von N = 1558 Studierenden aus der Ukraine ebenfalls selbst berichtete Bestechungshandlungen: 56% nannten Bestechungen für den Zugang zu einem Studiengang, 22% bei Klausuren, 18% für weitere Studienleistungen und 5% für Hausarbeiten. In einer Befragung im Kosovo gaben 20% der befragten Studierenden (N = 890) direkt an, dass sie Korruptionshandlungen durchführen würden, um einen Job zu erhalten (Llulaku & Bërxulli, 2017). Für Hochschulen in Ghana berichten Studierende auch ebenfalls relativ häufiges, wahrgenommenes Korruptionsverhalten von Universitätsmitarbeitenden (Nnodum, 2008). Für Spanien zeigen sich niedrigere bis mittlere Bereitschaften für korruptives Handeln bzw. subjektive Wahrnehmung solcher Handlungen (z.B. Julián & Bonavia, 2020; 2021; 2022), wobei Ergebnisse verschiedener Untersuchungen aufgrund der stark unterschiedlichen Erhebungsmethoden nicht direkt vergleichbar sind.
Für Hochschulen in Deutschland liegen ähnliche Untersuchungen allerdings nur wenig vor (oder ich habe sie nicht gefunden, vgl. zu Korruption im öffentlichen Dienst generell Stark, 2019). Weißmüller & De Waele (2022) untersuchten in einem quasi-experimentellen Befragungsdesign (N = 624), wie Studierende aus Deutschland, Belgien und den Niederlanden sind, verschiedene Arten von Bestechungshandlungen beurteilen. Sie nutzten dazu narrative Vignetten, die beschreiben, wie ein*e Studierende*r einer*m Lehrenden verschiedene Bestechungsformen „anbietet“, damit diese*r sie in einer eigentlich nicht-bestandenen Prüfung doch bestehen lässt. In der Befragung wurden die Befragten in die Position dieser Studierenden versetzt und sollten angeben, wie akzeptabel sie dieses Verhalten beurteilen. Die Vignetten repräsentierten dabei verschiedene Formen der Bestechung: zum ersten white bribery, in dem die fiktiven Studierende Versuchen ihre Lehrenden emotional zu beeinflussen (z.B. Weinen, Betteln), zum zweiten grey bribery, bei dem Studierende nicht-monetäre Dienste anbieten (z.B. eine helfende Hand) und zum dritten black bribery, was dem Angebot von Geld entspricht (konkret: 500€). In der Befragung wurden jeder Person zwei verschiedene Vignetten randomisiert zugeordnet. Generell zeigte sich dabei, dass je „dunkler“ eine Korruptionshandlung ist, Studierende eine geringere Bereitschaft zur Umsetzung angaben.
In einer quasi-experimentellen Befragung (N = 2287) konfrontierten Graeff et al. (2014) Studierende an ebenfalls mit narrativen Vignetten, in denen sie in eine Position als studentischer Tutor versetzt wurden, der ein Korruptionsangebot von Mitstudierenden erhält, um eine Prüfungsnote anzupassen. Sie mussten dann auf einer 10-stufigen Skala angeben, wie stark sie das Angebot annehmen würden bzw. in anderen Worten, inwiefern sie ihre Position als studentische Hilfskraft ausnutzen, um persönliche Vorteile zu erhalten. Dabei wurden in den Vignetten die Entdeckungswahrscheinlichkeit (operationalisiert durch die Vertrauenswürdigkeit der*des Mitstudierenden und Entdeckung durch eine Überprüfung der Arbeit der Tutorenarbeit), die Schwere von Sanktionen als Folge (Höhe einer Geldstrafe) und Vorteile der Korruptionshandlung (Höhe des Geldbetrags) variiert. Zusätzlich wurden sozialen Normen zur Korruption als weitere Variable erfasst. Zusammengefasst gaben dabei 73,5% der Befragten an, das Angebot definitiv nicht anzunehmen. Je höher der Vorteil, geringer die Kosten und geringer die Entdeckungswahrscheinlichkeit, desto bereiter waren die Studierenden.
Einflussfaktoren & Abhilfen
Ein wichtiger Einflussfaktor auf korruptes Verhalten von Studierenden ist dabei, inwiefern selbst das akademische bzw. das gesellschaftliche Gesamtumfeld als insgesamt korrupt wahrnehmen. Je stärker Studierende dies als korrupt wahrnehmen, desto eher berichten sie auch selbst, solche Handlungen durchzuführen oder dazu bereit zu sein, da es ja prinzipiell dazugehöre (Shaw et al., 2015; Sandigov, 2014). Dies ist dabei nicht auf Länder der ehemaligen Sowjetunion beschränkt, sondern zeigt sich z.B. auch in einer Untersuchung in Italien (Tomo et al., 2018), und wird auch in qualitativen Analysen im Rahmen von Interviewstudien deutlich (Zaloznaya, 2012). Dabei bleit natürlich die Frage, inwieweit die Entscheidung zu Korruptionshandlung auf rein individuellen Entscheidungen basiert, oder ob sich die Involvierten eher den „Regeln eines Systems“ folgen. Andere Einflussfaktoren auf individueller Ebene sind die Einstellungen und Orientierungen von Studierenden (z.B. ob sie Bestechung als kriminelle Handlung verstehen, Shaw et al., 2015; wie stark sie selbst Bestechung als soziale Norm ablehnen, vgl. Graeff et al., 2014; wie riskant sie ein Aufdecken empfinden oder inwiefern sie das Verhalten rechtfertigen können, Julián & Bonavia, 2021; ). Weißmüller & De Waele (2022) beobachteten auch einen Interaktionseffekt zwischen studiumsbezogenem Burnout und der Akzeptanz von „grauer“ Bestechung, der sich allerdings nicht in der Sub-Stichprobe für Deutschland zeigte. Eine höhere Bereitschaft zu eigenen Korruptionshandlungen steht dabei mit einer niedrigeren Bereitschaft in Zusammenhang, beobachtetes Korruptionshandeln Anderer zu melden (Julián & Bonavia, 2022).
Zu möglichen Maßnahmen akademische Korruption von Studierenden zu verringern bzw. zu verhindern (siehe hierzu auch unseren fünften Teil der Beitragsreihe) liegen hingegen wenig Erkenntnisse vor. Bspw. untersuchten Denisova-Schmidt et al. (2021) in einer experimentellen Befragung den kurzfristigen Einfluss verschiedener Informationsmaterialien zur Korruption und damit verbundener negativer Folgen auf die Einstellungen und Orientierungen Studierender in Russland zur Korruption (N = 2003). Dabei wurden die folgenden Materialien unterschieden: eine offizielle Broschüre zur Korruptions-awareness, eine Broschüre auf Basis von Materialien von Transparency International Russia und zwei verschiedene Videos von Transparency InternationalRussia. Diese Materialien wurden den Studierenden im Rahmen eines Interviews gezeigt, bevor sie nach ihren Einstellungen zur Korruption befragt wurden. Eine weitere Gruppe Studierender erhielt als Kontrollgruppe kein Treatment. Die Befragten wurden zufällig den einzelnen Maßnahmen zugeordnet (Würfelwurf). Die Autor*innen fassen ihre Ergebnisse folgendermaßen zusammen: „Concerning the effectiveness of the interventions, we do not find any important impacts in the full sample, but some indication of heterogeneous effects across sub-samples defined by students’ inclination to plagiarize when writing papers. One result is that some of the brochures or videos might promote awareness of the negative consequences of corruption among students who frequently plagiarize, but at the same time appear to induce more tolerant views on corruption among students who plagiarize less often“ (Denisova-Schmidt et al., 2021, 1663).
Das wird Folgen haben…
Zusammenfassend lässt sich festhalten, dass bisher relativ wenig Ergebnisse empirischer Untersuchungen zur akademischen Korruption von Studierenden vorliegen und die vorliegenden Analysen nur eingeschränkt vergleichbar sind. Dies ist insofern etwas problematisch, da akademische Korruption natürlich eine Reihe negativer Folgen mit sich bringt. Neben generellen gesellschaftlichen Folgen (z.B. gerechter Zugang zu Abschlüssen, z.B. Rumyantseva, 2005) hängt die Akzeptanz von Korruption im Beruf auch mit der Bereitschaft zusammen, im Studium selbst akademisches Fehlverhalten zu zeigen (Alva et al., 2020; Teixeira, 2013). Die Folgen akademischen Fehlverhaltens (und dann wieder mit einem stärkeren Fokus auf das Täuschen, Schummeln und Betrügen) werden wir aber in unserem letzten Beitrag zu dieser Reihe genauer betrachten. Er wird an dieser Stelle verlinkt, sobald er online ist.
Literatur:
Alva, E., Vivas, V., & Urcia, M. (2021). Tolerance of Future Professionals Towards Corruption. Analysis Through the Attitudes of Students of Lima’s Universities Regarding Situations Related to Ethics and Morals. Journal of Academic Ethics, 19(2), 211-227. (Online)
Denisova-Schmidt, E., Huber, M., Leontyeva, E., & Solovyeva, A. (2021). Combining experimental evidence with machine learning to assess anti-corruption educational campaigns among Russian university students. Empirical Economics, 60(4), 1661-1684. (Online)
Farrales, M. J. (2005). What is corruption?: A history of corruption studies and the great definitions debate. A History of Corruption Studies and the Great Definitions Debate (June 2005). Verfügbar auf SSRN. (Online)
Graeff, P., Sattler, S., Mehlkop, G., & Sauer, C. (2014). Incentives and inhibitors of abusing academic positions: Analysing university students’ decisions about bribing academic staff. European Sociological Review, 30(2), 230-241. (Online)
Julián, M., & Bonavia, T. (2022). Students‘ Perceptions of University Corruption in a Spanish Public University: A Path Analysis. Frontiers in psychology, 13, 842345-842345. (Online)
Julián, M., & Bonavia, T. (2021). Understanding unethical behaviors at the university level: A multiple regression analysis. Ethics & Behavior, 31(4), 257-269. (Online)
Julián, M., & Bonavia, T. (2020). Determinants of Students’ Willingness to Engage in Corruption in an Academic Setting: an Empirical Study. Journal of Academic Ethics, 18(4), 363-375. (Online)
Karimli, R. (2022). Bribery in Higher Education in Former Soviet Countries: A Systematic Review. The University of Western Ontario (Dissertation). (Online)
Kresse, W. J. (2017). Institutional Corruption in Higher Education: Analysis of Causes and Reforms at the Second-Largest Institution of Higher Education in Illinois. Journal of Academic Administration in Higher Education, 13(1), 35-40. (Online)
Llullaku, N., & Bërxulli, D. (2017). Student perceptions of workplace corruption and its effect on their academic motivation. EJSBS ISSN, 2301-2218. (Online)
Nnodum, B. I. (2008). Corrupt practices among academics as perceived by undergraduates: Implication for counselling and national development. International Journal of Educational Research, 4(1), 141-150. (Online)
Olbrisch, M. (2021, 06. Oktober). Notenmanipulation an der Uni Duisburg-Essen – Markt der Möglichkeiten. spiegel.de (Online)
Osipian, A. L. (2008). Corruption in higher education: does it differ across the nations and why?. Research in comparative and international education, 3(4), 345-365. (Online)
Temple, P., & Petrov, G. (2004). Corruption in higher education: Some findings from the states of the former Soviet Union. Higher education management and policy, 16(1), 83-99. (Online)
Rumyantseva, N. L. (2005). Taxonomy of corruption in higher education. Peabody Journal of Education, 80(1), 81-92. (Online)
Sadigov, T. (2014). Students as initiators of bribes: specifics of corruption in Azerbaijani higher education. problems of Post-communism, 61(5), 46-59. (Online)
Shaw, P., Katsaiti, M. S., & Pecoraro, B. (2015). On the determinants of educational corruption: The case of Ukraine. Contemporary Economic Policy, 33(4), 698-713. (Online)
Stark, C. (2019). Korruption im deutschen öffentlichen Dienst: Spannungsfelder und Problembereiche. In K. Möltgen-Sicking, H. Otten, M. Schophaus, & S. M., Vargas Côrtes (Hrsg.), Öffentliche Verwaltung in Brasilien und Deutschland (S. 267-285). Springer VS. (Online)
Teixeira, A. A. (2013). Sanding the wheels of growth: Cheating by economics and business students and ‘real world’corruption. Journal of Academic Ethics, 11(4), 269-274. (Online)
Tomo, A., Todisco, L., & Mangia, G. (2018). Contextual and individual characteristics effects on students’ corruption perception and behaviours in higher education. Journal of Economic and Administrative Sciences, 35(1), 28-43. (Online)
Transparency International e.V. (Hrsg.( (2022). Was ist Korruption?. URL: https://www.transparency.de/ueber-uns/was-ist-korruption/ (Online)
Weißmüller, K. S., & De Waele, L. (2022). Would you Bribe your Lecturer? A Quasi-experimental Study on Burnout and Bribery in Higher Education. Research in higher education, 63(5), 768-796. (Online)
Zaloznaya, M. (2012). Organizational cultures as agents of differential association: explaining the variation in bribery practices in Ukrainian universities. Crime, law and social change, 58(3), 295-320. (Online)
In unserer Artikelreihe zum Täuschen und Betrügen bei Prüfungen im Studium haben wir schon mehrfach feststellen können: auch die Hochschule ist von Schummelei und Betrug nicht frei (nur, falls das jemand ernstlich erwartet hätte…). In dieser Reihe schauen wir etwas genauer auf empirische Forschungsergebnisse zu akademischem Fehlverhalten. Im ersten Beitrag lag der Fokus auf verschiedenen Arten des Fehlverhaltens im Studium. Der zweite Beitrag behandelte Methoden, dieses Verhalten auch empirisch zu erfassen. Der dritte Beitrag drehte sich darum, wie verbreitet verschiedene Formen akademischen Fehlverhaltens eigentlich sind, während wir im zweigeteilten vierten Beitrag (Teil1, Teil 2) die vielfältigen Forschungsergebnisse zu möglichen Gründen und Ursachen dargestellt haben. In diesem Beitrag geht es nun um mögliche Maßnahmen, die ergriffen werden können, um akademischem Fehlverhalten zu begegnen. Dabei gehen wir auch der Frage nach, als wie wirksam bzw. erfolgreich sich verschiedene Maßnahmen erwiesen haben.
Zum Umgang mit Täuschungen bei Prüfungen in der Hochschule existieren verschiedene Ansätze und Maßnahmen. Einige beziehen sich übergreifend auf akademisches Fehlverhalten generell, während zugleich auch Maßnahmen vorgeschlagen werden, die auf spezifische Arten des Fehlverhaltens zielen. Grundsätzlich lassen sich Maßnahmen aber danach unterscheiden, ob sie eher dabei unterstützen, akademisches Fehlverhalten zu erkennen, um entsprechend darauf reagieren zu können. Oder, ob sie helfen sollen, das Aufkommen akademischen Fehlverhaltens präventiv zu verhindern (vgl. Sattler et al., 2017).
Detektion: Dies umfasst Maßnahmen, um bestehende Täuschungsversuche aufzudecken, bspw. die Nutzung von Plagiatserkennungssoftware bei Hausarbeiten (vgl. Awasthi, 2019), das Prüfen bzw. Nachrechnen, ob Datensätze evtl. erfunden wurden (Sattler et al., 2017) oder auch einfach das Beaufsichtigen bei Klausuren (Cizek, 1999). In Online-Prüfungen, die auch im Zuge der Distanzlehre während der COVID-19-Pandemie vermehrt durchgeführt wurden, kamen auch weitere Maßnahmen zur Detektion von Täuschungsversuchen hinzu (z.B. Videoüberwachung bei der Bearbeitung von Online-Klausuren, Holden et al., 2021). Das Aufdecken eines Täuschungsversuchs, mit welcher Maßnahme auch immer, ist meistens damit verbunden, dass auch eine Konsequenz für die täuschende Person folgt (in vielen Prüfungsordnungen als minimale Folge das automatische Nicht-Bestehen einer Prüfung).
Prävention: Dies meint Maßnahmen, die ergriffen werden, damit mögliche Täuschungs- und Betrugsversuche gar nicht erst auftauchen. Hierbei lassen sich zum einen Maßnahmen unterscheiden, die auf eine Gestaltung der Prüfungsbedingungen fokussieren. Hierunter fallen bspw. das Herstellen von großen Abständen zwischen Prüflingen in Klausuren, um Abschreiben zu erschweren (Yee & MacKown, 2009; Cizek, 1999) oder das Einschränken von möglichen Hilfsmitteln (z.B. nur einen Stift in Klausuren). Zum anderen finden sich Maßnahmen, die eher die Studierenden selbst in den Blick nehmen, so dass diese von sich aus keine Täuschungsversuche unternehmen. Dies reicht z.B. von Veränderungen im Studienplan, um Prüfungsdruck zu verringern (vgl. Parthner, 2020), über Schulungen zum wissenschaftlichen Arbeiten (Johannes et al., 2014) bis hin zu Honor Codes (McCabe et al., 1999). Bei Letzteren handelt es sich um „a community code of conduct guided by ethical principles defining the expecations for students tot act with honesty and integrity and acknowleding the sharde responsibilty of all members.“ (Tatum, 2022, 33). Ein solcher Verhaltenskodex ist mit einer expliziten Selbstverpflichtung verbunden und kann mit weiteren Maßnahmen (z.B. Veranstaltungen zur Einführung in wissenschaftliches Arbeiten) einhergehen kann, muss es aber nicht. Seinen Ausdruck findet solch ein Kodex bspw. häufig darin, dass Studierende bei Abgaben schriftlicher Prüfungsleistungen mit einer Unterschrift erklären müssen, eine Arbeit nach Standards akademischen Arbeitens angefertigt zu haben (in Deutschland oft so genannte Selbstständigkeitserklärungen).
Die Zuordnung der einzelnen Maßnahmen zu den beiden Kategorien ist nicht trennscharf, da Detektionsmaßnahmen natürlich auch präventiv wirken sollen. Sie erhöhen die Entdeckungswahrscheinlichkeit von Täuschungsversuchen, womit die Hoffnung verbunden ist, dass Studierende aufgrund der erwarteten negativen Folgen nicht versuchen, zu betrügen. Grundsätzlich fokussiert aber jede Maßnahme mehr oder weniger stark auf bestimmte Ursachen akademischen Fehlverhaltens bzw. steht mit verschiedenen Merkmalen der zu Prüfenden in Verbindung (siehe hierzu auch unseren vierten Beitrag in der Reihe). Während Detektionsmaßnahmen versuchen, negative Folgeerwartungen herzustellen, zielt die Herstellung bestimmter Testbedingungen darauf, keine Gelegenheiten für Fehlverhalten zuzulassen, damit Prüflinge gar nicht erst in Versuchung kommen. Der Ansatz solcher Maßnahmen beruht dabei eher auf einer negativen Fokussierung auf das falsche Verhalten (vgl. Lancaster, 2021). Maßnahmen mit dem Ziel, Kompetenzen, Selbstwirksamkeitserwartungen und positive Einstellungen Studierender zu verändern, werfen eher einen positiven Blick auf das richtige akademische Verhalten. Ihr Ziel ist daher die Förderung einer akademischen Integrität (Bretag, 2016), also, dass Studierende für sich selbst die Standards guter akademischer Praxis als Norm übernehmen und sich auch in der Lage fühlen diese umzusetzen. Sie haben daher auch eine moralische Komponente, die sich insbesondere in den schon erwähnten Honor Codes ausdrückt (vgl. Tatum, 2022).
Was wird wirklich getan?
Generell sind also eine Vielzahl von Maßnahmen zum Umgang mit akademischem Fehlverhalten möglich. Ob diese auch ihr Ziel erreichen, hängt neben der Frage, welche Maßnahmen eine Hochschule wählt, auch davon ab, wie diese genau implementiert werden und ob sie von Prüfenden selbst auch wirklich umgesetzt werden (vgl. Parthner, 2020). Dies bezieht sich bspw. darauf, welche Sanktionen für Fehlverhalten durchgesetzt werden, ob überhaupt systematisch Maßnahmen in Studiengängen verankert sind oder welche Personen für den Umgang mit akademischem Fehlverhalten zuständig sind. Zur Frage, welche Maßnahmen wie an Hochschulen implementiert werden, liegen ein paar Untersuchungen vor, die sich neben dem jeweiligen nationalen Hochschulkontext aber auch darin unterscheiden, welche Aspekte in den Fokus gerückt werden (z.B. Organisation von Angeboten, Zuständigkeiten, Maßnahmen).
Miron et al. (2021) analysierten bspw. auf Grundlage einer Befragung von N = 74 kanadischen Hochschulen, inwiefern diese Tutorials bzw. Kurse zur akademischen Integrität implementieren. Kurse zur akademischen Integrität werden dabei an 45 der befragten Hochschulen (60,8 %) angeboten, meist im Rahmen eines Moduls im ersten Semester, die aber meist nur einem Drittel der Studierenden zugänglich sind (also im Studienplan). Sie umfassen Tutorials mit Gesamtumfang von unter einer Stunde bis zu vier Stunden. Diese werden von Dozierenden, aber auch oft von Mitarbeiter*innen der Bibliotheken durchgeführt. In den Kursen waren die am drei am häufigsten thematisierten Inhalte das Plagiieren, Paraphrasieren und richtige Zitieren.
Für den deutschen Kontext berichten Sattler et al. (2017), wie häufig zehn ausgewählte Maßnahmen zur Detektion und Prävention akademischen Fehlverhaltens von Hochschullehrenden eingesetzt werden und welche Faktoren die Einsatzhäufigkeit beeinflussen. Basis ist eine Online-Befragung mit Selbstberichten von insgesamt N = 3655 Personen an vier deutschen Universitäten. Dabei mussten die Befragten für jede Maßnahme auf einer sieben-stufigen Skala einschätzen, wie häufig sie sie einsetzten (von 0 = nie bis 6 = immer). Zusammengefasst ergab sich dabei die folgende Reihung der am häufigsten genutzten Maßnahmen (in Klammern sind MW und SD der Skalenwerte angegeben, Sattler et al., 2017, 1131):
Dafür Sorge tragen, das Studierende bei Klausuren ausreichen Abstand voneinander haben (MW = 5,16 ; SD = 1,26).
Sicherstellen, dass bei Klausuren verbotene Hilfsmittel nicht genutzt werden(MW = 5,04 ; SD = 1,26).
Nutzung von Suchmaschinen zur Plagiatskontrolle (MW = 2,44 ; SD = 1,89).
Nutzung von Software zur Plagiatserkennung (MW = 1,38 ; SD = 1,99).
In dieser Liste zeigt sich natürlich auch, dass bestimmte Prüfungsformate von den Befragten häufiger selbst durchgeführt werden als andere. Als wichtige Einflussfaktoren ergaben sich in Regressionsanalysen bspw. die von den Dozierenden eingeschätzte Effektivität von Maßnahmen, der eingeschätzte Aufwand und inwiefern ein Einsatz von der Hochschuladministration erwartet wird. Moralische Orientierungen oder das Gefühl durch Täuschungen persönlich beleidigt zu sein, erwiesen sich als weniger wichtig. Generell ist die Haltung von Hochschullehrenden zum Umgang mit akademischem Fehlverhalten ein relevanter Faktor, der die Implementation von Maßnahmen positiv oder negativ beeinflussen kann (vgl. De Maio & Dixon, 2022; Lynch et al., 2021). Dies betrifft insbesondere die Einstellungen und Motive, akademisches Fehlverhalten zu melden bzw. zu sanktionieren.
Was davon bringt etwas?
Zur Frage, wie wirksam bestimmte Maßnahmen sind, also inwiefern sie dazu beitragen, dass akademisches Fehlverhalten reduziert wird, liegen vergleichsweise wenig Untersuchungen vor, die sich zudem im Forschungsansatz und im Fokus auf bestimmte Maßnahmen unterscheiden. Meist wird das Plagiieren betrachtet. Die Vergleichbarkeit von Forschungsergebnissen wird zudem dadurch erschwert, dass meist nicht die Wirkung einer spezifischen Maßnahme an sich untersucht werden kann, sondern eher die Wirkung einer konkreten Implementation in einem ganzen Programm (vgl. MacFarlane et al., 2014). Auch sind Studien, die ein experimentelles Kontrollgruppendesign verwenden (vgl. Bortz & Döring, 2016) aus ethischen Gründen schwierig, da man bei einer Kontrollgruppe, die keiner Maßnahme ausgesetzt wird, natürlich absichtsvoll ein Verhalten mit potentiell negativen Folgen (z.B. Nicht-Bestehen) zulässt. Nichtsdestotrotz können natürlich einige Ergebnisse zur Wirkung von Maßnahmen herangezogen werden. Trivial sind Erkenntnisse, dass der Einsatz von Detektionsmaßnahmen das Aufdecken von Fehlverhalten erhöht (z.B. Awasthi, 2019 für Plagiatssoftware). Fehlverhalten, dass sonst nicht bekannt wäre, kann dann natürlich entsprechend sanktioniert werden. Interessanter sind daher Untersuchungen zur Wirksamkeit von Präventionsmaßnahmen.
Relative gute Evidenz liegt dafür vor, dass Honor Codes akademisches Fehlverhalten reduzieren.„Overall, multiple studies spanning three decades have established that the presence of an honor code reduces academic misconduct and self-reported cheating and improves academic integrity in college students […]“ (Tatum, 2022, 34), wobei es nicht auf die reine Existenz ankommt, sondern dass diese auch an verschiedenen Stellen während Studiums eingesetzt bzw. angewendet werden (z.B. bei Selbständigkeitserklärungen) (vgl. McCabe et al., 1999). Insbesondere tragen Honor Codes dazu bei, dass Studierende selbst ein genaueres und korrektes Verständnis akademischen Fehlverhaltens erhalten und sich entsprechende soziale Normen innerhalb einer Hochschule entwickeln (Tatum, 2022). Explizite Kurse zu korrektem akademischen Verhalten bzw. zum korrektem wissenschaftlichen Arbeiten wirken sich ebenfalls positiv aus (z.B. Djokovic et al., 2022; Perkins et al., 2020). Niedrigschwellige Maßnahmen wie freiwillige Plagiatskontrollen bei studentischen Texten scheinen auch einen positiven Einfluss zu haben, allerdings die Einstellung zu akademischer Integrität nicht stark zu beeinflussen (Kohl, 2011).
Zusammenfassend lässt sich festhalten, dass zur Reduktion akademischen Fehlverhaltens integrierte Ansätze vielversprechend sind, die sowohl Studierenden wie Prüfenden die Bedeutung akademischer Integrität deutlich machen und zugleich alle beteiligen Gruppen auf verschiedenen Ebenen fortbilden (vgl. De Maio & Dixon, 2020; Schuh, 2014). Für die Wirksamkeit spezifischer anderer Maßnahmen liegen allerdings erstaunlich wenig empirische Untersuchungen vor (oder ich habe sie einfach nicht gefunden). Mit Bezug auf die Arbeit in unserer Nachwuchsforschungsgruppe ist zudem wichtig, dass auch bei performanzorientierten Prüfungsverfahren Täuschungsversuche vorkommen können, die sich negativ auf die Validität der Ergebnisse auswirken (Gortzmann et al., 2017). Dabei ist als zentrale Maßnahme zu vermeiden, dass Testinhalte und -materialien im Vorfeld bekannt werden.
Neben Täuschungen bei Prüfungen existieren allerdings noch weitere Arten akademischen Fehlverhaltens, die sich nicht unmittelbar, aber indirekt auf Prüfungen beziehen und andere Maßnahmen zur Prävention erfordern. Diese betrachten wir in unserem vorletzten Beitrag zu dieser Reihe. Er wird hier verlinkt, sobald er online ist.
Literatur:
Ali, I., Sultan, P., & Aboelmaged, M. (2021). A bibliometric analysis of academic misconduct research in higher education: Current status and future research opportunities. Accountability in research, 1-22. (Online)
Awasthi, S. (2019). Plagiarism and academic misconduct: A systematic review. DESIDOC Journal of Library & Information Technology, 39(2). (Online)
Bertram Gallant, T., & Rettinger, D. (2022). An introduction to 30 years of research on academic integrity. Journal of College and Character, 23(1), 1-5. (Online)
Bortz, J., & Döring, N. (2016). Forschungsmethoden und Evaluation für Human-und Sozialwissenschaftler: Limitierte Sonderausgabe (5. Aufl.). Springer. (Online)
Bretag, T. (2016). Defining Academic Integrity: International Perspectives – Introduction. In T. Bretag (Ed.), Handbook of Academic Integrity (pp. 3-6). Springer Nature. (Online)
Cizek, G. J. (1999). Cheating on tests: How to do it, detect it, and prevent it. Routledge.
De Maio, C., & Dixon, K. (2022). Promoting academic integrity in institutions of higher learning: What 30 years of research (1990-2020) in Australasia has taught us. Journal of College and Character, 23(1), 6-20. (Online)
Djokovic, R., Janinovic, J., Pekovic, S., Vuckovic, D., & Blecic, M. (2022). Relying on Technology for Countering Academic Dishonesty: The Impact of Online Tutorial on Students’ Perception of Academic Misconduct. Sustainability, 14(3), 1756. (Online)
Gotzmann, A., De Champlain, A., Homayra, F., Fotheringham, A., de Vries, I., Forgie, M., & Pugh, D. (2017). Cheating in OSCEs: The impact of simulated security breaches on OSCE performance. Teaching and Learning in Medicine, 29(1), 52-58. (Online)
Holden, O. L., Norris, M. E., & Kuhlmeier, V. A. (2021). Academic integrity in online assessment: A research review. Frontiers in Education, 6, 639814. (Online)
Johannes, D., Moritz, M. T., & Oestreicher, W. (2014). Gute Begleitung wissenschaftlicher Arbeiten als Ansatz zur Prävention akademischen Fehlverhaltens. Information-Wissenschaft & Praxis, 65(1), 3-8. (Online)
Kohl, K. E. (2011). Geschummelt wird selten: Erfahrungen mit der“ Freiwilligen Plagiatskontrolle“ für Studierende. Zeitschrift für Hochschulentwicklung, 6(2), 159-171. (Online)
Lancaster, T. (2021). Academic Dishonesty or Academic Integrity? Using Natural Language Processing (NLP) Techniques to Investigate Positive Integrity in Academic Integrity Research. Journal of Academic Ethics, 19, 364-383. (Online)
Lynch, J., Salamonson, Y., Glew, P., & Ramjan, L. M. (2021). “I’m not an investigator and I’m not a police officer“-a faculty’s view on academic integrity in an undergraduate nursing degree. International Journal for Educational Integrity, 17(1), 1-14. (Online)
MacFarlane, B., Zhang, J., & Pun, A. (2014). Academic integrity: a review of the literature. Studies in higher education, 39(2), 339-358. (Online)
McCabe, D. L., Trevino, L. K., & Butterfield, K. D. (1999). Academic integrity in honor code and non-honor code environments: A qualitative investigation. The Journal of Higher Education, 70(2), 211-234. (Online)
Miron, J., Eaton, S. E., McBreairty, L., & Baig, H. (2021). Academic integrity education across the Canadian higher education landscape. Journal of academic ethics, 19(4), 441-454. (Online)
Parnther, C. (2020). Academic misconduct in higher education: A comprehensive review. Journal of Higher Education Policy And Leadership Studies, 1(1), 25-45. (Online)
Perkins, M., Gezgin, U. B., & Roe, J. (2020). Reducing plagiarism through academic misconduct education. International Journal for Educational Integrity, 16(1), 1-15. (Online)
Sattler, S., Wiegel, C., & Veen, F. V. (2017). The use frequency of 10 different methods for preventing and detecting academic dishonesty and the factors influencing their use. Studies in Higher Education, 42(6), 1126-1144. (Online)
Schuh, D. (2014). Auf dem Weg zur akademischen Integrität–Ziele und Maßnahmen des Projekts „Akademische Integrität. Information-Wissenschaft & Praxis, 65(1), 41-50. (Online)
Tatum, H. E. (2022). Honor codes and academic integrity: Three decades of research. Journal of College and Character, 23(1), 32-47. (Online)
Yee, K., & MacKown, P. (2009). Detecting and preventing cheating during exams. In T. Twomey, H. White, & K. Sagendorf, Pedagogy, Not Policing – Positive Approaches to Academic Integrity a University (pp.141-147). The Graduate School Press.
Unter Federführung der School of Education der Universität Tübingen veranstaltet eine Kooperation von Lehrerbildner*innen der Universitäten Dresden, Hannover, Münster und Tübingen im Wintersemester 2022/2023 die zweite Staffel der Online-Veranstaltungsreihe „Fachgespräche Lehrerinnen- und Lehrerbildung. Forschung. Diskurs.Perspektiven.“ Dabei werden verschiedene Fragen und Herausforderungen der Lehrkräftebildung von eingeladenen Expert*innen thematisiert und mit den Teilnehmenden diskutiert. Die Reihe richtet sich an interessierte und fachkundige Akteur*innen der Lehrkräftebildung. In der ersten Staffel ging es bspw. um Fragen der Lehrkräftegewinnung (die uns auch schon hier im Blog beschäftigt haben, z.B. in unserer Beitragsreihe zum Quereinstieg), den Einsatz von Videos in der Lehrkräftebildung oder die Ungewissheit pädagogischen Handelns.
Das besondere dieser Gesprächsreihe liegt im Format der einzelnen Termine. Nach einem zentralen Hauptvortrag werden jeweils kritische Impulse und weiterführende Gedanken durch eine*n critical friend ergänzt. Beides wird von erfahrenen und im jeweiligen Forschungsfeld etablierten Kolleg*innen gestaltet. Zum Abschluss wird aber auch bewusst eine Perspektive durch eine Person der next generation, also Forscher*innen, deren akademische Karriere eher noch am Anfang steht. Es handelt sich also insgesamt um keinen Podcast im eigentlichen Sinne: Die einzelnen Vorträge bzw. Themen wurden und werden allerdings aufgezeichnet und über den Youtube-Kanal der Tübingen School of Education (TüSE) zur Verfügung gestellt.
Der Flyer zur zweiten Staffel ist online hier zu finden. Wir weisen hier im Blog aber natürlich nicht ganz uneigennützig auf das Programm hin ;). Christoph hat nämlich die Ehre, die diesjährige Staffel mit eröffnen zu dürfen. Und zwar als Vertreter der next generation beim Thema „Herausforderungen institutionalisierter Lehrkräftebildung aus der Perspektive der Fachdidaktiken“. Der Hauptvortrag wird gehalten von Prof. Dr. Michael Hemmer (Universität Münster, Didaktik der Geographie), critical friend ist Prof. Dr. Sabine Doff (Universität Bremen, Fremdsprachendidaktik Englisch). An dieser Stelle auch herzliche Grüße an die beiden!
Um an Veranstaltungen der Fachgespräche teilzunehmen ist eine Anmeldung notwendig (zu finden hier). Daher: eine herzliche Einladung und Empfehlung! Für einen ersten Einblick haben wir hier unten einen Beitrag aus der ersten Staffel eingebettet. Er behandelt auch insbesondere Fragen der Lehrkräftebildung, um die wir uns in unserer Nachwuchsforschungsgruppe kümmern: „Von den Basisdimensionen zu den handlungsnahen Kompetenzen“. Der Hauptvortrag ist/war von Prof. Dr. Mirjam Steffensky (Universität Hamburg, Didaktik der Chemie), critical friend ist/war Prof. Dr. Anna-Katharina Praetorius (Universität Zürich, Pädagogisch-psychologische Lehr-Lernforschung und Didaktik ) und aus der next generationDr. Stefan Sorge (Leibniz-Institut für Pädagogik der Naturwissenschaften und Mathematik Kiel, Didaktik der Physik). Auch an euch sehr herzliche Grüße!