Schlagwort-Archive: Meidinger

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 4/12 – Teil 4

Todsünde Nr. 3: Zu viele unausgereifte Reformen im Bildungssystem

In einer Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei wird betrachtet, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Grundsätzlich ist sollte man das entsprechende Buchkapitel zuvor gelesen haben, was ich ausdrücklich empfehlen möchte. Dies ist der vierte Teil eines Beitrags, der sich mit der dritten vom Autoren so bezeichneten Todsünde beschäftigt. Thesen aus dem Buch werden dabei im Konjunktiv wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll, sondern einfach den Regeln zur indirekten Rede folgt. Die Kernthese des zugehörigen Buchkapitels ist zusammengefasst, dass im Bildungssystem zu viele Veränderungen vorgenommen würden, ohne vorher ausreichend erprobt und/oder danach ausreichend evaluiert zu werden (siehe hierzu den ersten Teil). Heinz-Peter Meidinger begründet dies an drei Beispielen von Reformen genauer, die sich aus seiner Sicht besonders negativ ausgewirkt hätten (1. das Konzept „Lesen lernen durch Schreiben“, siehe den ersten Teil; 2. den frühen Fremdsprachenunterricht, siehe den zweiten Teil). Das dritte Beispiel ist die Einführung von Bachelor- und Masterstudiengängen, die ich aufgrund des Umfangs, der von Heinz-Peter Meidinger angesprochenen Aspekte auf zwei eigene Teile aufgeteilt habe. Im dritten Teil wird der Hintergrund der Einführungen genauer beschrieben und die erste These, mit der Heinz-Peter Meidinger begründet, warum er diese Reform für nicht gelungen erachtet, vor dem Hintergrund von Ergebnissen empirischer Untersuchungen betrachtet: die Studienzeiten hätten sich durch die Einführung nicht verkürzt, auch aufgrund schlechter Berufsaussichten Absolvent*innen mit Bacherlorabschluss. In diesem letzten Teil zur Todsünde Nr. 3 geht es um die noch nicht betrachteten drei Gründe aus dem Buchkapitel.

  • Die Mobilität Studierender, einen Teil ihres Studiums im Ausland zu absolvieren (Auslandssemester) hätte nicht zugenommen.
  • In Bachelorstudiengängen würde ein größerer Anteil Studierender ihr Studium abbrechen, als in nicht-gestuften Studiengängen vor dem Bologna-Prozess.
  • Über die Qualität gestufter Studiengänge „gibt es vielfach Klagen“ (Meidinger, 2021, 59).

In die weite Welt hinein…

Die Erhöhung der internationalen Mobilität im Studium ist, anders als eine Veränderung der Studienzeiten (siehe den dritten Teil), explizit ein offizielles Ziel der Maßnahmen des Bologna-Prozesses (Deutscher Bundestag, 2021; Bologna-Erklärung, 1999), das für Deutschland genauer konkretisiert wurde. Gemäß Internationalisierungsstrategie der Gemeinsamen Wissenschaftskonferenz (GWK, 2013) werden zwei Mobilitätsziele unterschieden. Zum ersten sollten bis 2020 mindestens 50% aller Hochschulabsolvent*innen studienbezogene Auslandserfahrung gesammelt haben. Zum zweiten sollten bis 2020 mindestens ein Drittel aller Hochschulabsolvent*innen „einen studienbezogenen Auslandsaufenthalt von mindestens drei Monaten und/oder 15 ECTS nachweisen können“ (DAAD, 2024). Bei beidem verbringen Studierende also einen Teil ihrer Studienzeit im Ausland (so genannte temporäre Mobilität oder Credit mobility, vgl. DAAD, 2023). Studierende können aber natürlich auch direkt ein Studium in einem anderen Land aufnehmen und es vollständig dort absolvieren (so genannte abschlussbezogene Mobilität oder Degree mobility, vgl. DAAD, 2023). Diese Ziele beziehen sich auf inländische Studierende aus Deutschland. Natürlich ist es aber auch Ziel des Bologna-Prozesses, dass Studierende aus dem Ausland vermehrt ein Studium oder zumindest Teile davon an deutschen Hochschulen absolvieren. Zur Frage, inwiefern diese Ziele erreicht wurden, können einige empirische Untersuchungen herangezogen werden, auf deren Basis man zu unterschiedlichen Schlussfolgerungen kommen kann. Zum ersten beruhen diese Unterschiede darauf, welche Daten in der jeweiligen Untersuchung herangezogen werden (z.B. Amtliche Statistiken auf Basis von Meldedaten der Hochschulen, Studierendenbefragungen des Deutschen Akademischen Auslands Dienstes (DAAD), Statistiken des ERASMUS-Programms der Europäischen Kommission, Sozialerhebung des DZHW, eine gute Übersicht bieten Hillmann & Karpenstein, 2018). Zum zweiten kommt es auch darauf, was alles als Auslandsaufenthalt in die oben genannten Zielkategorien einbezogen wird, da dabei beträchtliche Unterschiede bestehen können (z.B. ein zweiwöchiges Praktikum bei einer Firma bis hin zu ganzen Studienjahren an Hochschulen im Ausland). Zum dritten hängt es auch davon ab, welche Schwerpunkte in den vorliegenden Publikationen gesetzt wurden (z.B. wird nicht jeder Kennwert in jedem jährlichen Bericht veröffentlicht).

Nach dem letzten Bericht der Bundesregierung zur Umsetzung der Ziele des Bologna-Prozesses (Bundestag, 2021) habe sich die Anzahl von deutschen Studierenden im Ausland seit dem Jahr 2000 verdoppelt und 34% der Studierenden im höheren Semester haben studienbezogene Auslandserfahrungen gemäß des ersten Mobilitätsziels sammeln können (temporäre Mobilität). Hierbei bezieht sich der Bericht auf die Mobilitätsstudie des DAAD und des DZHW aus dem Jahr 2017. Andere Quellen nennen für das Jahr 2017 einen Anteil von 38% Studierender mit Erfahrung temporärer Mobilität im Studium (DAAD, 2017), was einer Steigerung entspräche (von 32% im Jahr 2013 und 37% im Jahr 2015; DAAD, 2017). Woisch & Willige (2015) berichten hingegen von 26% für das Jahr 2013 und 30% für das Jahr 2015 (basierend auf anderen Panel-Daten). Für die Jahre zwischen 2000 und 2012 werden an anderer Stelle basierend auf unterschiedlichen Datenquellen temporäre Mobilitätsquoten zwischen 30% und 32% angegeben, für die Zeit vor der Einführung der Bachelor- und Masterstudiengänge 20% für das Jahr 1991, 23% für das Jahr 1994 und 29% für das Jahr 1997 (DAAD, 2013). Jahr & Teichler (2007) berichten für Absolvent*innen der Jahrgänge 1994/1995 eine temporäre Mobilitätsquote von 13,6%. Diese Zahlen beziehen sich auf beide formulierte Zielklassen. Für das zweite Ziel (Aufenthalt mindestens drei Monate, 15 ECTS-Punkte) wurde basierend auf gemeldeten Daten der hochschulischen Prüfungsstatistik, die sich auf anerkannte ECTS-Leistungen aus anderen Ländern beziehen, für das Prüfungsjahr 2018 eine temporäre Mobilitätsquote von 7,5% berechnet (DeStatis, 2020), wobei auch hier Unsicherheiten in der Erfassung bestehen: „Offensichtlich sind die in der Statistik abgebildeten Mobilitätsquoten maßgeblich von den Bemühungen der Hochschulen geprägt, die Auslandsmobilität nach den Vorgaben des novellierten Hochschulstatistikgesetzes möglichst vollständig zu erfassen.“ (DeStatis, 2020, 14).

Reifenberg & Philipps (2023) berichten Ergebnisse einer Befragung des DAAD von N=115.100 Studierenden von 74 Hochschulen im Wintersemester 2020/2021 hinsichtlich ihres Mobilitätsverhaltens (Benchmark internationale Hochschule, BintHo). Dabei wurden Studierende in allen Abschnitten des Studienverlaufs befragt. Zum Befragungszeitpunkt gaben 19% der Studierenden an, schon einen studienbezogenen Auslandsaufenthalt absolviert zu haben, 16% einen fest geplant zu haben und 13% wahrscheinlich einen absolvieren zu wollen. Dabei unterscheiden sich diese Mobilitätsangaben stark zwischen Hochschulart, angestrebter Abschlussart (Bachelor oder Master) und studierten Fächern. So gaben bspw. 21,5% der Studierenden an Universitäten einen Auslandsaufenthalt an, an HAWs 15,9%. Der Anteil mit Auslandserfahrung im Master (42,3% an Universitäten) ist höher als im Bachelor (13,7% an Universitäten). Nur bezogen auf die Universitäten reicht zwischen den Fächern der Anteil von 28,4% temporärer Mobilität in den Geisteswissenschaften an Universitäten bis zu 15,2% in Mathematik & Naturwissenschaften. Solche großen Unterschiede zwischen Fächern und angestrebter Abschlussart zeigen sich auch in anderen Untersuchungen (z.B. DAAD, 2023; DAAD, 2017; DeStatis, 2020), wobei Unterschiede zwischen Fächern auch davon abhängen, zu was für Gruppen Studiengänge genau zusammengefasst werden. In der BintHo-Untersuchung wurde auch erfragt, inwiefern die Auslandsaufenthalte als verpflichtender Teil eines Studiengangs absolviert werden mussten. Nur bezogen auf Universitäten betrug der Pflichtanteil der absolvierten Auslandsaufenthalte 16,5%. Der Verpflichtungsanteil ist dabei für Lehramtsstudiengänge am größten (39,5%). Im Bachelor werden temporäre Auslandsaufenthalte primär im fünften Semester absolviert, im Master im dritten Semester. Der Übergang zwischen Bachelor- und Masterstudium wurde nur von 4% der Studierenden als Zeitpunkt angegeben. Häufigste Art der Mobilität ist ein klassisches Auslandssemester (71,2% an Universitäten), gefolgt von Praktika (25,2% an Universitäten) und der Studienreise (8,9% an Universitäten). Die häufigste Dauer des temporären Aufenthalts liegt zwischen drei und sechs Monaten (46,9%). Auch bzgl. der Mobilitätsarten und Aufenthaltsdauern zeigen sich ähnliche Ergebnisse auch in anderen Untersuchungen (z.B. DAAD, 2023; DAAD, 2017).

Wie sieht es spezifisch bei Lehramtsstudiengängen aus, die wir hier im Blog ja besonders in den Fokus nehmen? Je nach Untersuchung werden auch Ergebnisse spezifisch für Lehramtsstudierende ausgewertet. Für den Jahrgang 2016 bspw. wird eine temporäre Mobilitätsquote von insgesamt 26% berichtet (DAAD, 2019), die sich stark zwischen Schularten und Fächergruppen unterscheidet. Studierende für das Lehramt an Gymnasien verfügen am häufigsten über studienbezogene Auslandserfahrung (33%), während Studierende für die anderen Schulformen etwas weniger angeben (18% bis 21%). Die Fachgruppe mit dem höchsten Mobilitätsanteil sind dabei die Sprach- und Kulturwissenschaften mit 35% mit den höchsten Anteilen für Romanistik (78%) und Anglistik (59%). Diese Studiengänge haben meist einen verpflichtenden Anteil von Auslandsaufenthalten. Lehramtsstudierende geben als relevante Schwierigkeit für Auslandsaufenthalte insbesondere den Zeitverlust im Studium an (54%), was im Vergleich zu anderen Studiengängen eher hoch ist (diese liegen bei 33%; DAAD, 2019; vgl. Reifenberg & Philipps, 2023; Woisch & Willige, 2015). Die komplexe Studienstruktur im Lehramt mit mindestens zwei Fächern könnte sich also auch in der etwas geringeren Mobilitätsquote als der Durchschnitt abbilden (vgl. Ahlgrimm et al., 2018).

Bildnachweis: DAAD, 2019, 95, lizensiert unter CC-BY-SA 4.0 DEED

Diese Ergebnisse beziehen sich auf temporäre Mobilität im Studium (Credit mobility). Welche Erkenntnisse liegen für Studierende aus Deutschland vor, die ihr gesamtes Studium im Ausland absolvieren (abschlussbezogene Mobilität, Degree mobility)? Auf Basis von Daten des statistischen Bundesamtes kann zunächst festgestellt werden, dass die Zahl deutscher Studierender im Ausland zwischen 1991 und 2010 kontinuierlich angestiegen ist, mit größerem Zuwachs ab den Jahren 2003 und 2004 (DAAD, 2013). Zwischen 2002 und 2010 stieg der Anteil der Studierenden im Ausland an allen inländischen Studierenden von 3,4% auf 6,0% (DAAD, 2023). Seit 2015 gibt es allerdings keine signifikanten Zuwächse mehr und der Anteil ist im Jahr 2021 sogar leicht gesunken auf 4,9% (was aber auch an der größeren Zahl Personen liegt, die ein Studium im Inland begonnen haben, DAAD, 2023, 9). Die Zahl ausländischer Studierender, die ein Studium in Deutschland absolvieren, ist zwischen 2011 und 2021 um 94% gestiegen. Zwischen 2003 und 2011 gab es hingegen wenig Veränderungen, zuvor stieg die Zahl aber auch zwischen 1997 und 2002 an (DAAD, 2013).

Welches Fazit lässt sich jetzt bzgl. des Einflusses der Einführung gestufter Bachelor- und Masterstudiengänge auf das Mobilitätsverhalten Studierender ziehen? Das hängt ein wenig von der Perspektive ab bzw. welche Art von Mobilität betrachtet wird. Bzgl. abschlussbezogener Mobilität sind im Zeitverlauf definitiv Zuwächse feststellbar, sowohl was die Mobilität von Deutschland ins Ausland und umgekehrt betrifft. Bzgl. temporärer Mobilität fasst der DAAD folgendermaßen zusammen:

„Zwischen 1991 und 2000 stieg der Anteil der Studierenden (in höheren Semestern) mit temporären Auslandsaufenthalten stark an (von 20% auf 32%) und stabilisierte sich bis 2006 auf diesem Niveau. Seitdem ist allerdings ein kontinuierlicher Rückgang zu beobachten, auf 19% bei der bislang letzten Erhebung im Jahr 2021. Anders als bei der abschlussbezogenen Mobilität war die Einführung des zweigliedrigen Studiensystems mit Bachelor- und Masterstudiengängen hier also nicht mit einem Anstieg der temporären studienbezogenen Mobilität verbunden.“

(DAAD, 2023, 9)

Für die Interpretation wichtig sind aus meiner Sicht allerdings die Details. So bestehen große Unterschiede bzgl. Hochschularten, Fächern und sogar teilweise zwischen einzelnen Hochschulen (vgl. z.B. DeStatis, 2020), so dass die reine Umstellung des Systems nicht die einzige ausschlaggebende Ursache zu sein scheint. Es liegt auch daran, wie Auslandsaufenthalte in konkreten Studiengängen an konkreten Hochschulen implementiert werden (z.B. die Pflichtaufenthalte in vielen Lehramtsstudiengängen). Für die Jahre 2020 und 2021 gibt es auch Auswirkungen der COVID-19 Pandemie (vgl. DAAD, 2023). Der teilweise Anstieg der Mobilität auch schon vor der Einführung gestufter Studiengänge in Deutschland ist auch ein Hinweis darauf, dass die Mobilität im Studium stärker mit den Möglichkeiten zur finanziellen Förderung für solche Aufenthalte zusammenhängt, als mit der „reinen“ Studienstruktur auf Systemebene. Schon vor Einführung gab es bspw. eine Ausweitung von Förderprogrammen der Europäischen Union (z.B. das Sokrates-Programm). Generell zeigt sich in empirischen Untersuchungen, dass die Wahrscheinlichkeit eines Auslandsaufenthalts auch vom sozio-ökonomischen Hintergrund der Studierenden abhängt (z.B. Finger, 2012; vgl. Banscherus, Himpele & Staack, 2011). Teilweise besteht auch eine große Unsicherheit bzw. Varianz der Ergebnisse nach unterschiedlichen Datenquellen (vgl. Lanzendorf, Schomburg & Teichler, 2012) und es sollte auch die Tatsache beachtet werden, dass erst mit Einführung von Bachelor- und Masterstudiengängen überhaupt vertiefte Bemühungen begonnen wurden, aussagekräftige statistische Daten zu erheben (vgl. DAAD; 2017). Insofern hat der Bolognaprozess auch dazu geführt, dass überhaupt analysierbare Daten vorliegen, was für die „alten“ einphasigen Studiengänge nicht im selben Maße gesagt werden kann. Unabhängig von diesen Unsicherheiten lässt sich aber festhalten, dass die konkret beschlossenen Ziele bzw. internationalen Mobilitätsquoten in Deutschland noch nicht erreicht sind (DAAD, 2023). Für diesen Aspekt gibt es aber zumindest eine solche Zieldefinition, die quantitativ prüfbar ist. Zur Frage, wie sich die Mobilität Studierender innerhalb Deutschlands seit der Einführung der gestuften Studiengänge verändert hat, gibt es interessanterweise weniger Erkenntnisse aus empirischen Untersuchungen (z.B. Gareis, Diller & Huchthausen, 2018).

Bei der Stange bleiben

Heinz-Peter Meidinger stellt ebenfalls die These auf, es würde ein größerer Anteil Studierender ihr Studium abbrechen, als in nicht-gestuften Studiengängen vor dem Bologna-Prozess. Je nach Quelle werden unter Studienabbruch verschiedene Phänomene zusammengefasst (Neugebauer et al., 2019). Im engeren Sinne ist ein Studienabbruch das vollständige Beenden eines Studiums bzw. das Verlassen des Hochschulsystems einer Person ohne Abschluss (Heublein & Schmelzer, 2020), unabhängig davon, ob es sich auf ein Diplom-, Bachelor- oder ein angeschlossenes Masterstudium bezieht. Davon zu unterscheiden sind Studienunterbrechungen, bei denen ein Studium für eine zeitlang pausiert und danach wieder aufgenommen wird, und Wechsel zwischen Studiengängen oder -fächern. Bei letzterem wird natürlich ein Studiengang ohne Abschluss verlassen, aber nicht das Hochschulsystem, da ja etwas Anderes weiter studiert wird. Daneben gibt es Phänomene wie das so genannte Parkstudium, bei dem sich Personen in einen Studiengang einschreiben, ohne irgendeine Studienaktivität aufzunehmen. Gründe hierfür können z.B. sein, dass notwendige Wartezeiten überbrückt werden sollen, bis man für einen Studiengang zugelassen wird, den man eigentlich studieren möchte, oder einfach Vorteile des Studierendenstatus nutzen möchte (z.B. Vergünstigungen). Dieses Phänomen tritt häufig in Studiengängen ohne Zulassungsbeschränkung (numerus clausus) wie Physik auf (Düchs & Ingold, 2016). Diese Unterscheidungen sind deshalb wichtig, da zur empirischen Bestimmung von Abbruchquoten meist statistische Daten herangezogen werden, in denen nicht immer klar zwischen diesen Phänomenen unterschieden werden kann, was zu unterschiedlichen Ergebnissen führen kann (Neugebauer et al., 2019). Beim einfachsten Verfahren zur Ermittlung von Abbruchquoten werden bspw. einfach die Anzahlen Studienanfänger*innen und Absolvent*innen mit einem gewissen zeitlichen Abstand zueinander in Beziehung gesetzt (so genanntes Kohortenvergleichsverfahren, Heublein, Richter & Schmelzer, 2020). Bei diesem Verfahren können Abbruchquoten überschätzt werden, weil eben Wechsel oder Unterbrechungen nicht vollständig berücksichtigt werden. Für eine genauere Abschätzung sind längsschnittliche Daten notwendig, die Studierverläufe von Personen individuell betrachten.

Je nach Datenquelle werden unterschiedliche Studienabbruchquoten berichtet. Auf Basis der Prüfungsstatistiken des Statistischen Bundesamts betrugen die Studienabbruchquoten für Studierende mit Ersteinschreibung zwischen 2009 und 2013 zwischen 21,3 und 24,8% (DeStatis, 2023). Betrachtet man nur Bachelorstudierende liegen sie zwischen 22,7% und 26,5%, nur für das Lehramt zwischen 17,4% und 22,4%. Für den Jahrgang 2007 liegt die Gesamtquote bei 21,4% (DeStatis, 2021). Das Statistische Bundesamt verwendet zur Berechnung einen Korrekturfaktor, bei dem versucht wird, Wechsel und Studierende, die noch nicht fertig studiert haben, angemessen zu berücksichtigen. Für die Jahrgänge 1997 bis 2001, die ihr Studium auf jeden Fall vor der Einführung von Bachelor- und Masterstudiengängen begonnen haben, werden Abbruchquoten zwischen 24,5% und 28,7% berichtet. Nur für die einphasigen Diplomstudiengänge liegen sie zwischen 33,2% und 34,7%, nur für das Lehramt zwischen 24,5% und 28,7%. Das DZWH verwendet ein Kohortenvergleichsverfahren ebenfalls auf Basis der amtlichen Statistik (Neugebauer et al., 2019). Für die Studienanfänger*innen zwischen den Jahren 2012 und 2016 liegen die Abbruchquoten nach diesem Verfahren für Bachelorstudierende zwischen 27% und 31% (im Lehramt zwischen 10% und 21%) sowie für Masterstudierende zwischen 17% und 323% (im Lehramt zwischen 9% und 16%) (Heublein, Hutzsch & Schmelzer, 2022). Die Zahlen bewegen sich dabei auch für frühere Jahrgänge auf einem vergleichbaren Niveau (Heublein et al., 2020), wobei kaum Unterschiede zwischen „alten“ und „neuen“ Studiengängen festgestellt wurden (Heublein et al., 2012; Heublein et al., 2008).

Dabei bestehen in allen Jahrgängen und Untersuchungen mehr oder wenige große Unterschiede zwischen Studierenden verschiedener Fachgruppen, Hochschularten und angestrebten Abschlüssen. Diese Studien haben aber die schon angesprochenen Schwächen bzgl. möglicher Verzerrungen. Spezifisch für das Lehramt ermöglichen ein paar Untersuchungen solche Abschätzungen für spezifische Hochschulen bzw. Bundesländer. In der schon angesprochenen Untersuchung von Dietrich (2016) zum Vergleich des Staatsexamensmodells mit dem Bachelor-Master-Modell bei Lehramtsstudierenden an der Universität Leipzig werden auf Basis von Längsschnittdaten für beide Modelle eher niedrige Abschlussquoten von 47,4% (Staatsexamen) und 49,5% (Bachelor/Master) festgestellt. Dabei wurde beobachtet, dass ein möglicher Abbruch im Staatsexamensmodell später erfolgt (Median im vierten Semester) als im gestuften System (Median im zweiten Semester). Für das Land Mecklenburg-Vorpommern untersuchten Radisch et al. (2018) längsschnittliche Verlaufsdaten von Lehramtsstudierenden basierend auf Verwaltungsdaten der Universitäten Rostock und Greifswald. Einbezogen wurden dabei N=5781 Lehramtsstudierende, die zwischen den Wintersemestern 2012/2013 und 2017/2018 für ein Lehramtsstudium eingeschrieben waren. Dabei zeigt sich ein nach Schulformen unterschiedlicher Umfang von „Schwund“ im Studium: „Im Lehramt an Gymnasien sind die Kohorten nach zwei Semestern um etwa 30 Prozent geschrumpft , im Lehramt an Regionalen Schulen teilweise um bis zu 40 Prozent.“ (Güldener et al., 2020). Im Lehramt für die Grundschule und Sonderpädagogik ist der „Schwund“ geringer. Studienabbrüche im engeren Sinn machen allerdings nur einen Teil dieses „Schwunds“ aus (für das Lehramt an Gymnasien z.B. 41% des „Schwunds“). Die Studierenden benötigen tendenziell länger als die Regelstudienzeit bis zum Abschluss. Auf Basis einer längsschnittlichen Teilstichprobe der PaLea-Studie (n=787 Studierende) kann nach einer Bernholt, Zimmermann & Möller (2023) eine grobe Schwundquote von ca. 39,5% abgeschätzt werden, wobei im PaLea-Panel Abbrüche nicht gleichmäßig erfasst wurden. Sind diese Quoten nun höher oder niedriger als für Lehramtsstudiengänge vor der Einführung von Bachelor- und Masterstudiengängen auch im Lehramt? Auf Basis von Kohortenvergleichsstudien berichtet bspw. Gesk (1999) für Lehramtsstudierende der pädagogischen Hochschulen in Baden-Württemberg mit Studienbeginn Anfang der 1990er Jahre eine durchschnittliche Abbruchquote von ca. 40%. Ebenfalls für die pädagogischen Hochschulen in Baden-Württemberg bestimmte Rauin (2007) eine Abbruchquote von ca. 30% für die ersten drei Semester für Studierende mit Studienbeginn 1995.

Vor dem Hintergrund der Ergebnisse vorliegender Untersuchungen scheint sich durch die Einführung von Bachelor- und Masterstudiengängen wenig an Studienabbruchquoten verändert zu haben. Auch hier treten ähnliche Schwierigkeiten wie bei der Ermittlung von Mobilitätsquoten auf, da die verfügbaren Datengrundlagen letztendlich eher Abschätzungen von Ober- und Untergrenzen ermöglichen. Auch hier bestehen große Unterschiede zwischen Studiengängen und Fächern. Die Veränderung der Studienstrukturen allein scheint keine direkte Ursache für Veränderungen bei Studienabbrüchen zu sein. Hier sind andere Gründe und Motive ausschlaggebend, die eher die konkrete Gestaltung von Studiengängen betreffen und weniger den Rahmen auf Systemebene (z.B. Theune, 2021; Neugebauer et al., 2019; Heublein & Wolter, 2011; Blüthmann, Lepa & Thiel, 2008).

Qualitätsurteile

Heinz-Peter Meidingers vierte These zur Einführung von Bachelor- und Masterstudiengängen bezieht sich darauf, dass über die Qualität gestufter Studiengänge „vielfach Klagen“ (Meidinger, 2021, 59) gäbe. Leider bleibt diese These unspezifisch darin, wer genau über was genau klagt. Grundsätzlich ist bzw. war der gesamte Bologna-Prozess und die damit verbundene Einführung der gestuften Studiengänge in Deutschland mit vielfältiger Kritik verbunden, die sich auf verschiedenste Aspekte bezieht bzw. bezog (z.B. Winter, 2018; Tegeler, 2010; Wernstedt & John-Ohnesorg, 2010; Hechler & Pasternak, 2009; Belz et al., 2005; Flegel, 2000). So wurde bspw. gerade zu Beginn der Einführungen eine „Verschulung“ des Studiums befürchtet (z.B. Moser, 2021; Kühl, 2018), wobei mit dem Begriff je nach Perspektive unterschiedliche Dinge assoziiert wurden. Häufig wird und wurde damit ein Gegensatz zwischen Lehren und Lernen in den Institutionen Schule und Hochschule ausgedrückt, der sich darauf bezieht, dass das Studieren „freier“ sei als Lernen in der Schule teilweise mit Bezug zum Humboldtschen Bildungsideal (vgl. Tenorth, 2013). „Mit dem Etikett der Verschulung wird dabei eine Vielzahl von Phänomenen erfasst: Fixe Stundenpläne, klassenorientierte Lehr- und Lernorganisation, Anleitung statt selbstorganisiertes Lernen, permanente Anwesenheitspflichten einhergehend mit einer hohen Kontrolldichte und Prüfungsinflation […]“ (Kühl, 2018). Allerdings können natürlich auch einphasige Studiengänge je nach Fach mehr oder weniger Wahlfreiheiten beinhalten (z.B. naturwissenschaftliche Studiengänge hierarchischer aufgebaut als viele Studiengänge der Geisteswissenschaften). Klagen und Kritik sind aber kein Spezifikum für Bachelor- und Masterstudiengänge. Auch vor der Bologna-Reform gab es vielfach Klagen über die Ausgestaltung des Studiums (ein sehr plakatives Beispiel ist die Studentenbewegung der 60er Jahre des letzten Jahrhunderts). Gemeckert wurde also schon immer ;).

Inwiefern sind Klagen über Bachelor- und Masterstudiengänge vor dem Hintergrund von Ergebnissen empirischer Untersuchungen evtl. doch gerechtfertigt? Eine generelle Schwierigkeit bei der Einordnung von Kritik besteht darin, dass sie für die empirische Prüfung auf die konkrete Implementation von Studiengängen an konkreten Hochschulen bezogen sein muss. Aussagen über die Folgen auf Systemebene sind dadurch erschwert. Auf diese Ebene zielt allerdings die vierte These von Heinz-Peter Meidinger. Es wären also Untersuchungen erforderlich, die kontrolliert möglichst viele Studiengänge an unterschiedlichen Orten mit einbeziehen, und das natürlich vor und nach der Einführung „neuer“ Studiengänge. Solche aufwändigen Studien liegen aber kaum vor bzw. auch hier wurden umfangreichere Daten zur Studierqualität zeitlich erst im Zuge des Bologna-Prozesses erhoben, so dass weniger gute Vergleichsdaten zur Zeit davor vorliegen. Daneben muss natürlich für eine empirische Erhebung genauer definiert werden, welche Qualitätsaspekte des Studiums adressiert werden sollen bzw. was genau untersucht werden soll. Nichtsdestotrotz gibt es natürlich eine Vielzahl von Untersuchungen, die auch verschiedene Perspektiven aufgreifen. Da Heinz-Peter Meidinger allerdings nicht spezifischer wurde, habe ich für diesen Beitrag einfach ein paar exemplarische Beispiele ausgewählt.

Bspw. wurde im Projekt ZEITLast (Schulmeister & Metzger, 2011) ausgehend von Kritik an der Einführung der Bachelor-Studiengänge untersucht, wie groß die Workload und damit auch die Belastung ist, die Studierende erfahren. Methodisch wurden so genannte Zeitbudget-Analysen genutzt. Hierbei mussten teilnehmende Studierende in einem digitalen Tool täglich in gegliederten Zeitintervallen abgeben (kleinste Einheit: 15 Minuten), welche Tätigkeiten sie durchgeführt haben (aus einer Liste von Tätigkeiten). Es wurde relativ strikt vorgegangen, bspw. musste eine Erfassung zeitnah (max. bis 17 Uhr des Folgetags) erfolgen. Der Untersuchungszeitraum erstreckte sich jeweils auf die sechs Monate eines vollen Semesters. Zum Ende des Projekts wurden Daten von N=681 Studierenden aus 29 verschiedenen Studiengängen unterschiedlicher Universitäten und Fächer (erhoben zwischen dem Wintersemester 2009 und 2018) ausgewertet (Schulmeister & Metzger, 2018). Das Vorwort des ersten Zwischenberichts gibt einen guten, aber natürlich durch die Interpretation der Autor*innen gefärbten Eindruck bzgl. der Ergebnisse.

„Selten hat es eine Studie […] gegeben, welche die vorgefassten Meinungen und die vor Beginn aufgestellten Hypothesen in so grundlegender Art und Weise widerlegt hat. Nach aller Kenntnis der kritischen Bologna-Faktoren und den vielen und anhaltenden Studierenden-Protesten waren wir davon ausgegangen, dass im Bachelor-Studium eine fürchterliche Belastung auf die Studierenden zukäme. […] Wir haben in den Zeitbudget-Analysen feststellen müssen, dass die Zeit, die die Studierenden in das Studium investieren, im Mittel viel geringer ist als von früheren Befragungen ermittelt und weit unter den von Bologna und den Modulhandbüchern geforderten Werten liegt.“

(Schulmeister & Metzger, 2011, 7)

Konkreter in Zahlen ausgedrückt, haben die Studierenden basierend auf ihren Zeitbudget-Angaben in einem Semester im Bachelorstudium im Durchschnitt 24 Stunden pro Woche für studienbezogene Tätigkeiten (Metzger & Schulmeister, 2020). Darin sind alle Arten von Tätigkeiten inkludiert (z.B. Veranstaltungsteilnahmen, Selbststudium, Prüfungsvorbereitung). Wichtig ist allerdings, dass eine unheimliche große Varianz zwischen Studierenden, Fächern, Hochschulen und auch Zeitraum besteht (z.B. wird unmittelbar vor Prüfungen sehr viel Zeit investiert, in der vorlesungsfreien Zeit sehr wenig). Es gibt also auch Studierende mit objektiv sehr hohem Workload, aber eben auch einige Studierende mit so gut wie gar keinem Workload. Zwischen Zeitaufwand und Noten bestand so gut wie keine Korrelation (Schulmeister & Metzger, 2018). Studierende in untersuchten Diplomstudien der Stichproben unterschieden sich im Studierverhalten nicht besonders stark von den Studierenden in Bachelor-Studiengängen. Andere Untersuchungen kamen zu ähnlichen Ergebnissen (Kuhlee, 2020). Allerdings kann auch mit der ZEITLast-Studie natürlich kein direkter Einfluss der Einführung der „neuen“ Studiengänge an sich untersucht werden, da leider derartige Analysen für die vorherigen Studiengänge nicht vorliegen.

In einer anderen Untersuchung befragten Sieverding et al. (2013) N=405 Studierende an verschiedenen Universitäten, die zwischen Sommersemester 2009 und 2010 einen klassischen Diplom- oder einen Bachelor-Studiengang im Fach Psychologie absolviert haben, nach ihrem Studieraufwand, empfundenen Anforderungen und Entscheidungsspielräumen im Studium, der subjektiv empfundenen Belastung und ihrer Lebens- und Studierzufriedenheit. In Regressionsanalysen ergaben sich Unterschiede zwischen den Studienformen dahingehend, dass Bachelor-Studierende eine höhere Belastung und etwas geringere Studienzufriedenheit berichteten, der aber allerdings im Wesentlichen über Anforderungen mediiert wird. Der Grund für die Unterschiede zwischen den Studiengängen lag also darin, dass Bachelor-Studierende im Vergleich höhere Anforderungen berichtet haben (die Autor*innen vermuten aufgrund eines größeren Notendrucks). Entscheidungsspielräume spielten für die Studienzufriedenheit, aber nicht für das Belastungserleben eine Rolle. Die Ergebnisse werden allerdings dadurch eingeschränkt, dass zum Studienzeitpunkt kaum Diplom-Studierende unterer Semester einbezogen werden konnten. In anderen Untersuchungen wurden ebenfalls die Einschätzungen von Bachelor- und Diplomstudierenden verglichen. In der Analyse der erziehungswissenschaftlichen Studiengänge der Universität Gießen von Kaufmann & Fraij (2013) ergab sich bspw., dass Studierende beider Studiengänge, die Studierqualität hinsichtlich Studierbarkeit, Wissenschaftlichkeit und Lehrqualität sehr ähnlich beurteilten. Signifikante Unterschiede ergaben sich nur darin, dass Diplom-Studierende die Betreuung durch Dozierende schlechter und den Praxisbezug besser bewertete. Eine Untersuchung an der Universität Bern ergab ebenfalls kaum Unterschiede in den Einschätzungen Studierender in gestuften oder einphasigen Studiengängen (Franzen & Poitner, 2013). Zlatkin-Troitschanskaia et al. (2012) untersuchten, inwiefern sich die Entwicklung des wirtschaftswissenschaftlichen Fachwissens bei Diplom- und Bachelor-Studierenden der Wirtschaftswissenschaften und Wirtschaftspädagogik an einer Universität und einer Fachhochschule (N=771-1198 Studierende, je nach Erhebungszeitpunkt) unterschied. Sie resümieren, „dass seitens des Studienmodells kein eindeutiger Effekt nachgewiesen werden kann.[…] Von allen im Projekt ILLEV erhobenen strukturellen Merkmalen erweisen sich die Faktoren aus der Mesoebene, insbesondere die Anzahl und Art der besuchten Lehrveranstaltungen, als bedeutende Prädiktoren.“ (Zlatkin-Troitschanskaia et al., 2012, 431). Süß, Siewek & Köllner (2011) analysierten sogar, ob sich durch die Bologna-Reform Veränderungen beim ehrenamtlichen Engagement von Studierenden ergaben, was nicht der Fall war.

Hat die Qualität von Studiengängen durch die Einführung des Bachelor- und Master-Systems abgenommen? Hat die Belastung der Studierenden zugenommen? An diesen exemplarischen Beispielen wird deutlich, dass sich dies pauschal nicht beantworten lässt. Es kommt eben auf die konkrete Implementation vor Ort an. An manchen Hochschulen trifft es zu, an manchen nicht. Das liegt aber nicht direkt an der Einführung auf der Systemebene, sondern eher an den agierenden Personen. Dadurch, dass in vielen Fällen das gleiche Lehrpersonal für alle Studienformen zuständig war, ist auch eigentlich erwartbar, dass sich studentische Qualitätseinschätzungen zwischen den Studiengängen eher weniger unterscheiden sollten.

Wie schlimm war denn nun die Reform?

Ist die Einführung von Bachelor- und Masterstudiengängen im Zuge des Bologna-Prozess nun ein Beispiel für eine – nach Ansicht von Heinz-Peter Meidinger – „misslungene Reform“ (Meidinger, 2021, 58)? Vor dem Hintergrund der vorliegenden Ergebnisse empirischer Bildungsforschung ist dies wie bei vielen Aspekten des Bildungssystems auf struktureller Ebene nicht eindeutig entscheidbar bzw. nur differenziert nach bestimmten Aspekten. Grundsätzlich sind die Vergleiche zwischen einphasigen und gestuften Studiengängen immer dadurch erschwert, dass sich Studiengänge einzelner Hochschulen zwischen Fachdisziplinen stark unterscheiden, was sich auch in den Untersuchungsergebnissen widerspiegelt. Zum zweiten besteht, ähnlich wie bei Untersuchungen zum Schulsystem, auch hier die Schwierigkeit der Eingangsselektivität (vgl. den zweiten Beitrag zu dieser Todsünde). Neben Änderungen an der formalen Struktur von Studiengängen veränderte sich bspw. auch die Zusammensetzung der Studierenden im Zeitverlauf. So nahmen im Jahr 2022 54,7% eines Altersjahrgangs ein Studium auf, im Jahr 2003 waren es 39,3% (vgl. Autor:innengruppe Bildungsberichterstattung, 2022). Im Zuge dessen haben sich auch die Voraussetzungen verändert, mit denen Studierende ihr Studium beginnen (z.B. die durchschnittliche Abiturnote, sozio-ökonomischer Hintergrund), was sich auch auf viele der in Heinz-Peter Meidingers Thesen angesprochenen Aspekte auswirken könnte (vgl. Finger, 2012; Banscherus et al., 2009). Daher sind Unterschiede zwischen „alten“ und „neuen“ Studiengängen nicht nur auf die Gestaltung der Studiengänge selbst zurückführbar. Zum dritten muss bei einem Vergleich auch beachtet werden, welche Zeiträume betrachtet werden. Die ersten entwickelten Studiengänge kurz nach der Jahrtausendwende unterscheiden sich natürlich von den Studiengängen, die im Jahr 2024 an Hochschulen angeboten werden.

Generell ist es immer schwierig, eine Systemumstellung gut zu untersuchen, da eine solche Umstellung eben Veränderungen im System, also für alle Akteur*innen bedeutet. Empirische Untersuchungen sind daher zu einem gewissen Grad so etwas wie eine Operation am offenen Herzen. Auffällig ist bezogen auf den Bologna-Prozess, dass erst im Zuge dieser Neuausrichtungen überhaupt systematisch Daten zu Studienstrukturen, -qualität und -wirkungen erhoben wurden. Insofern ist ein Argument wie „Früher waren die Studiengänge besser!“ kaum prüfbar und auch etwas unfair, weil dadurch die „neuen“ Studiengänge einem stärkeren Rechtfertigungsdruck ausgesetzt werden als die „älteren“. Zusammenfassend lässt sich aber sagen, dass die Bologna-Reform in vielen Aspekten keine bis wenige negative Auswirkungen hatte, sondern eher dazu beigetragen hat, auch negative Aspekte der einphasigen Studiengänge explizit zu machen. Wie bei vielem im Bildungssystem kommt es auch im Studium eher auf die Qualität der Tiefenstruktur (Fauth et al., 2020; vgl. Oppermann, 2020) von Lehr-Lern-Umgebungen an, als den formalen, organisatorischen Rahmen. Und diese hängt vom Handeln der lehrenden Personen ab, die auf dafür viele Freiheiten haben, egal, ob sie in einphasigen oder gestuften Studiengängen tätig sind. Und diese Freiheit ist an Hochschulen noch größer, als an Schulen. Generell lässt sich festhalten, das vieles an Kritik, die im Zuge des Bologna-Prozess geäußert wird bzw. wurde sehr normativ gefärbt ist und häufig die Ansichten und Erfahrungen einzelner Kritker*innen widergibt, die manchmal schon, aber auch häufig nicht mit den Ergebnissen systematischerer empirischer Untersuchungen übereinstimmen. Das ist aber auch erwartbar, schließlich betrifft gerade die Umstellung des Studiensystems die meisten Wissenschaftler*innen unmittelbar, weshalb sich häufig die Rolle der*des Forschenden mit der Rolle der*des Betroffenen vermischt.

Unausgereifte Reformen als Todsünde

Die dritte von Heinz-Peter Meidinger so genannte Todsünde der Schulpolitik bezieht sich darauf, dass zu viele unausgereifte Veränderungen des Bildungssystems vorgenommen und diese zugleich einen negativen Einfluss auf die Beteiligten haben würden. Für eine bessere Einschätzung, ob die für die drei genannten Beispiele für derartigen Reformen genannten Prämissen und Schlussfolgerungen auch im Einklang mit Ergebnissen empirischer Bildungsforschung stehen, haben wir uns mit ihnen in vier Beiträgen hier im Blog etwas ausführlicher beschäftigt. Anmerken möchte ich zum Ende dieser Beitragsreihe, dass das zugehöriger Kapitel zu dieser Todsünde im Buch neun DIN A6-Seiten umfasst. Aber gut, es ist ja auch als Streitschrift formuliert.

Zum Ende des Kapitels verweist Heinz-Peter Meidinger darauf, dass Olaf Köller auf die Frage, „was bei Schulleistungsvergleichen erfolgreiche Bundesländer […] anders machen als die Rankingschlusslichter“ (Meidinger, 2021, 60) gesagt hätte, dass es die Kontinuität in der Schulpolitik wäre (wahrscheinlich gemeint als Gegensatz zu zu vielen, schlechten Veränderungen, das ist aber meine Interpretation und wird nicht so explizit ausgeführt). Ich kann mir persönlich gut vorstellen, dass Olaf Köller so etwas oder zumindest etwas Ähnliches gesagt hat. Leider gibt es im Buch keine Quelleangabe zu dieser Aussage und auch meine (vielleicht auch nicht genügend tiefgehende Suche) hat kein entsprechendes Zitat gefunden. Grundsätzlich stimme ich zu, dass eine abgestimmte, systematische Strukturierung eines Bildungssystems mit einer höheren Wahrscheinlichkeit für gute Lernleistungen einhergeht. Das kann aber auch Reformen umfassen, die natürlich gut umgesetzt sein sollten. Da stimme ich Heinz-Peter Meidinger explizit zu, aber ob eine spezifische Reform dieses Merkmal erfüllt, sollte durch systematische empirische Untersuchungen geprüft werden und nicht allein auf Einschätzungen individueller Akteur*innen. Die vierte Todsünde der Bildungspolitik wird Gegenstand des nächsten Beitrags in dieser Artikelreihe sein. Er wird an dieser Stelle verlinkt, sobald er online zugänglich ist.

Literatur:

  • Ahlgrimm, F., Westphal, A., Wallert, A., & Heck, S. (2018). Weshalb Studierende (nicht) ins Ausland gehen: Prädiktoren für Mobilität im Lehramtsstudium. In C. Falkenhagen, N. Grimm, & L. Volkmann (Hrsg.), Internationalisierung des Lehramtsstudiums – Modelle, Konzepte, Erfahrungen (S. 211-233). Schöningh. (Online)
  • Autor:innengruppe Bildungsberichterstattung (2022). Bildung in Deutschland 2022 – Ein indikatorengestützter Bericht mit einer Analyse zum Bildungspersonal. wbv. (Online)
  • Banscherus, U., Gulbins, A., Himpele, K., & Staack, S. (2009). Der Bologna-Prozess zwischen Anspruch und Wirklichkeit – Die europäischen Ziele und ihre Umsetzung in Deutschland – Eine Expertise im Auftrag der Max-Traeger-Stiftung. GEW. (Online)
  • Banscherus, U., Himpele, K., & Staack, S. (2011). Die soziale Dimension. Der blinde Fleck im Bologna-Prozess. Die Hochschule – Journal für Wissenschaft und Bildung, 20(1), 142-154). (Online)
  • Belz, J., Bleckmann, C., Haak, B., Homann, A., Horlemann, M., Köstner, B., & Wodtke, P. (2005). Der Bologna-Prozess in den archäologischen Wissenschaften. Ein Blick auf die Entwicklungen aus studentischer Perspektive. Archäologische Informationen28(1&2), 105-110. (Online)
  • Bernholt, A., Zimmermann, F., & Möller, J. (2023). Frühe Prädiktoren des Studienabbruchs im Lehramtsstudium. In T. Kauper, A. Bernholt, J. Möller, & O. Köller (Hrsg.), PaLea: Professionelle Kompetenzen und Studienstrukturen im Lehramtsstudium (S. 149-178). Waxmann.
  • Blüthmann, I., Lepa, S., & Thiel, F. (2008). Studienabbruch und-wechsel in den neuen Bachelorstudiengängen. Zeitschrift für Erziehungswissenschaft11(3), 406-429. (Online)
  • Bologna-Erklärung (1999). Der Europäische Hochschulraum – Gemeinsame Erklärung der Europäischen Bildungsminister Juni 1999. Bologna. (Online)
  • Deutscher Akademischer Austausch Dienst (DAAD) (Hrsg.) (2013). Wissenschaft weltoffen – Daten und Fakten zur Internationalität von Studium und Forschung in Deutschland und weltweit 2013. wbv. (Online)
  • Deutscher Akademischer Austausch Dienst (DAAD) (Hrsg.) (2017). Wissenschaft weltoffen – Daten und Fakten zur Internationalität von Studium und Forschung in Deutschland und weltweit 2017. wbv. (Online)
  • Deutscher Akademischer Austausch Dienst (DAAD) (Hrsg.) (2019). Wissenschaft weltoffen – Daten und Fakten zur Internationalität von Studium und Forschung in Deutschland und weltweit 2019. wbv. (Online)
  • Deutscher Akademischer Austausch Dienst (DAAD) (Hrsg.) (2023). Wissenschaft weltoffen – Daten und Fakten zur Internationalität von Studium und Forschung in Deutschland und weltweit 2023. wbv. (Online)
  • Deutscher Akademischer Austausch Dienst (DAAD) (Hrsg.) (2024). Auslandsmobilität: Zielquoten und Formen. Website des DAAD. (Online)
  • Deutscher Bundestag (Hrsg.) (2021). Bericht der Bundesregierung über die Umsetzung der Ziele des Bologna-Prozesses 200 bis 2020. Drucksache 19/27965. (Online)
  • Destatis (Hrsg.) (2011). Erfolgsquoten Berechnung für die Studienanfängerjahrgänge 1997 bis 2001. Statistisches Bundesamt. (Online)
  • Destatis (Hrsg.) (2020). Messung der internationalen Mobilität der Studierenden 2020. Statistisches Bundesamt. (Online)
  • Destatis (Hrsg.) (2021). Erfolgsquoten Berechnung für die Studienanfängerjahrgänge 2007 bis 2011. Statistisches Bundesamt. (Online)
  • Destatis (Hrsg.) (2023). Erfolgsquoten Berechnung für die Studienanfängerjahrgänge 2009 bis 2013. Statistisches Bundesamt. (Online)
  • Dietrich, S. (2016). Lehrerbildung in Sachsen – modularisiert zum Erfolg? Effektivität der Bachelor/Master-Lehrerausbildung am Beispiel der Universität Leipzig. DDS–Die Deutsche Schule108(1), 93-106. (Online)
  • Düchs, G.,& Ingold G.-L. (2016). Gut geparkt ist noch nicht studiert – Statistiken zum Physikstudium an den Universitäten in Deutschland 2016. Physik-Journal, 15(8/9), 28-33. (Online)
  • Franzen, A., & Pointner, S. (2013). Reform beeinflusste Studierende kaum. UniPress-Forschung und Wissenschaft an der Universität Bern, 156, 38-39. (Online)
  • Fauth, B., Göllner, R., Lenske, G., Praetorius, A. K., & Wagner, W. (2020). Who sees what? Conceptual considerations on the measurement of teaching quality from different perspectives. In A.-K. Praetorius, J. Grünkorn, & E. Klieme (Hrsg.), Empirische Forschung zu Unterrichtsqualität. Theoretische Grundfragen und quantitative Modellierungen (S. 138-155). Beltz Juventa. (Online)
  • Finger, C. (2012). Steht die Welt allen offen? Bologna und die internationale Mobilität der Studierenden. WZBrief Bildung, 20. Wissenschaftszentrum Berlin für Sozialforschung. (Online)
  • Flegel, I. (2000). Diplom ade?: Die neuen Bachelor‐und Masterstudiengänge konkurrieren mit dem Diplom—der Zusammenhalt der Physikfachbereiche bröckelt. Physikalische Blätter56(3), 20-24. (Online)
  • Gareis, P., Diller, C., & Huchthausen, H. (2018). Braindrain und Bologna-Drain–Räumliche Implikationen der Bologna-Reform und Auswirkungen auf ländliche Räume. Eine Analyse am Beispiel der Justus-Liebig-Universität Gießen. Raumforschung und Raumordnung| Spatial Research and Planning76(4), 281-296. (Online)
  • Gesk, I. (1999). Studienabbruch an Pädagogischen Hochschulen: Dargestellt am Studiengang für das Lehramt an Grund- und Hauptschulen. PH Heidelberg. (Online)
  • Güldener, T., Schümann, N., Driesner, I., & Arndt, M. (2020). Schwund im Lehramtsstudium. DDS–Die Deutsche Schule112(4), 381-398. (Online)
  • GWK (Hrsg.) (2013). Strategie der Wissenschaftsminister/innen von Bund und Ländern für die Internationalisierung der Hochschulen in Deutschland. GWK. (Online)
  • Hechler, D., & Pasternack, P. (2009). Bologna. Zentral-und Sonderaspekte. Zur anstehenden Reparaturphase der Studienstrukturreform. Die Hochschule – Journal für Wissenschaft und Bildung, 18(2), 6-17. (Online)
  • Heublein, U., Schmelzer, R., Sommer, D.; & Wank, J. (2008). Die Entwicklung der Schwund-und Studienabbruchquoten an den deutschen Hochschulen – Statistische Berechnungen auf der Basis des Absolventenjahrgangs 2006. HIS. (Online)
  • Heublein, U., & Wolter, A. (2011). Studienabbruch in Deutschland. Definition, Häufigkeit, Ursachen, Maßnahmen. Zeitschrift für Pädagogik57(2), 214-236. (Online)
  • Heublein, U., Richter, J., Schmelzer, R., & Sommer, D. (2012). Die Entwicklung der Schwund-und Studienabbruchquoten an den deutschen Hochschulen – Statistische Berechnungen auf Basis des Absolventenjahrgangs 2010. HIS. (Online)
  • Heublein, U., Richter, J., & Schmelzer, R. (2020). Die Entwicklung der Studienabbruchquoten in Deutschland. DZHW Brief 3|2020. DZHW. Online
  • Heublein, U., Hutzsch, C., & Schmelzer, R. (2022). Die Entwicklung der Studienabbruchquoten in Deutschland. DZHW Brief, 05|2022. DZHW. (Online)
  • Hillmann, J., & Karpenstein, A. (2018). Auslandsmobilität in den MINT-Fächern – Überblick, Vergleich und Wirkung. Vortrag auf der Tagung „Hinaus in die Welt! Steigerung der Auslandsmobilität deutscher MINT-Studierender“ der Internationalen Akademie des DAAD, 16. April 2018. Bonn. (Online)
  • Jahr, V., & Teichler, U. (2007). Graduates‘ international experience and mobility. In U. Teichler (Ed.), Careers of university graduates: Views and experiences in comparative perspectives (pp. 211-224). Springer Netherlands. (Online)
  • Kaufmann, B., & Fraij, A. (2013). Studienqualität vor dem Hintergrund des Bologna-Prozesses: ein Vergleich der Studienqualität zwischen Diplom-, Bachelor-und Masterstudierenden der erziehungswissenschaftlichen Studiengänge an der Universität Gießen – Eine querschnittliche Analyse. Institut für Erziehungswissenschaft, Universität Gießen. (Online)
  • Kühl, S. (2018). Verschulung wider Willen. Die ungewollten Nebenfolgen einer Hochschulreform. In N. Hericks (Hrsg.), Hochschulen im Spannungsfeld der Bologna-Reform: Erfolge und ungewollte Nebenfolgen aus interdisziplinärer Perspektive (S. 295-309). Springer. (Online)
  • Kuhlee, D. (2020). Brauchen wir eine Workload-Diskussion? Zur Rolle formaler Studienworkloads für das Lern-und Studierhandeln. Eine empirische Studie bei Lehramtsstudierenden des Master of Education. In D. Großmann, C. Engel, J. Junkermann, & T. Wolbring (Hrsg.), Studentischer Workload: Definition, Messung und Einflüsse (S. 293-312). Springer. (Online)
  • Lanzendorf, U., Schomburg, H., & Teichler, U. (2012). Statistiken zur internationalen Mobilität – methodische Probleme und erkennbare Fakten. In B.M. Kehm, H. Schomburg, & U. Teichler (Hrsg.) Funktionswandel der Universitäten: Differenzierung, Relevanzsteigerung, Internationalisierung (S. 475-492). Campus Verlag. (Online)
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Metzger, C., & Schulmeister, R. (2020). Zum Lernverhalten im Bachelorstudium. Zeitbudget-Analysen studentischer Workload im ZEITLast-Projekt. In D. Großmann, C. Engel, J. Junkermann, & T. Wolbring (Hrsg.), Studentischer Workload: Definition, Messung und Einflüsse (S. 233-251). Springer. (Online)
  • Moser, J. (2021). Verschulung und Bürokratisierung. Zeitschrift für Volkskunde117(1), 78-80. (Online)
  • Oppermann, R. (2020). Tiefenstrukturen – Ansätze für wirksames und nachhaltiges Lehren und Lernen an der DHBW. In J. Weber, B. Schiller, & J. Fünfgeld (Hrsg.), Lehre, Forschung, Transfer & Management-Beiträge aus der Fakultät Wirtschaft der DHBW Stuttgart: Festschrift für Prof. Dr. Bernd Müllerschön, (S. 258-263). DHBW. (Online)
  • Radisch, F., Driesner, I., Arndt, M., Güldener, T., Czapowski, J., Petry, M., & Seeber, A.-M. (2018). Abschlussbericht: Studienerfolg und -misserfolg im Lehramtsstudium. Zugriff am 30.09.2020. Verfügbar unter: https://www.regierung-mv.de/serviceassistent/_php/download.php?datei_id=1605186
  • Rauin, U. (2007). Im Studium wenig engagiert – im Beruf schnell überfordert: Studierverhalten und Karrieren im Lehrerberuf – kann man Risiken schon im Studium prognostizieren? Forschung Frankfurt: Wissenschaftsmagazin der Goethe-Universität, 25 (3), 60–64.
  • Schulmeister, R., & Metzger, C. (Hrsg.). (2011). Die Workload im Bachelor: Zeitbudget und Studierverhalten.: Eine empirische Studie. Waxmann. (Online)
  • Schulmeister, R., & Metzger, C. (2018). Das Studierverhalten im Bachelor. Zeitbudget-Analysen der Workload in 29 Bachelor-Stichproben. Hamburg. (Online)
  • Sieverding, M., Schmidt L. I., Obergfell, J., & Scheiter, F. (2013). Stress und Studienzufriedenheit bei Bachelor-und Diplom-Psychologiestudierenden im Vergleich – Eine Erklärung unter Anwendung des Demand-Control-Modells. Psychologische Rundschau64(2), 94-100. (Online)
  • Süß, S., Sieweke, J., & Köllner, B. (2011). Studienbelastung und gemeinnütziges Engagement von Studierenden nach der Bologna-Reform, Hochschulmanagement, 78(4), 78-83. (Online)
  • Tegeler, A. (2010). Leistungsbewertungen, Prüfungen, Verschulung. Ein Beitrag aus studentischer Sicht. Erziehungswissenschaft21(40), 135-143. (Online)
  • Tenorth, H. E. (2013). „Bildung und Wissenschaft “–Brauchen wir noch die Universität?. In N. Ricken, H-C. Koller, & E. Keiner (Hrsg.), Die Idee der Universität-revisited. (S. 45-62). Springer. (Online)
  • Theune, K. (2021). Determinanten und Modelle zur Prognose von Studienabbrüchen. In M. Neugebauer, H-D. Daniel, & A. Wolter (Hrsg.), Studienerfolg und Studienabbruch (S. 19-40). Springer. (Online)
  • Wernstedt, R., & John-Ohnesorg, M. (Hrsg.) (2010). 10 Jahre nach Bologna – Ziele und Umsetzung der Studienstrukturreform. Friedrich Ebert Stiftung. (Online)
  • Winter, M. (2018). Bologna – die ungeliebte Reform und ihre Folgen. In N. Hericks (Hrsg.), Hochschulen im Spannungsfeld der Bologna-Reform: Erfolge und ungewollte Nebenfolgen aus interdisziplinärer Perspektive (S. 279-293). Springer. (Online)
  • Zlatkin-Troitschanskaia, O., Förster, M., & Happ, R. (2012). Bologna-Reform–Ergebnisse aus einer vergleichenden empirischen Studie zwischen den auslaufenden Diplom-und den neuen Bachelor-/Masterstudiengängen. Zeitschrift für Berufs-und Wirtschaftspädagogik108(3), 420-437. (Online)

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 4/12 – Teil 3

Todsünde Nr. 3: Zu viele unausgereifte Reformen im Bildungssystem

In einer Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei wird betrachtet, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Grundsätzlich ist daher hilfreich, das entsprechende Buchkapitel gelesen zu haben, was ich auch an dieser Stelle ausdrücklich empfehlen möchte. Dies ist der dritte Teil eines Beitrags, der sich mit der dritten vom Autoren so bezeichneten Todsünde beschäftigt. Thesen aus dem Buch werden im Konjunktiv wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll, sondern einfach den Regeln zur indirekten Rede folgt. Im ersten Teil wurde die Kernthese des zugehörigen Buchkapitels genauer beschrieben: zusammengefasst würden im Bildungssystem zu viele Veränderungen vorgenommen , ohne vorher ausreichend erprobt und/oder danach ausreichend evaluiert zu werden. Heinz-Peter Meidinger beschreibt hierfür drei Beispiele von Reformen näher, die sich aus seiner Sicht besonders negativ ausgewirkt hätten. Im ersten Teil ging es um das Konzept „Lesen lernen durch Schreiben“, im zweiten Teil um den frühen Fremdsprachenunterricht in der Grundschule. In diesem dritten und dem noch folgenden vierten Teil geht es um die Einführung von Bachelor- und Masterstudiengängen in Deutschland im Zuge des so genannten Bologna-Prozesses. Die von Heinz-Peter Meidinger hierzu angesprochenen Aspekte sind so umfangreich, dass ich sie für eine bessere Lesbarkeit in zwei Blogbeiträge aufgeteilt habe.

Worum geht es eigentlich genau?

Bildnachweis: Bologna-Kommission, gemeinfrei

1997 schlossen der Europarat und die UNESCO einen ersten völkerrechtlichen Vertrag, in dem vereinbart wurde, Hochschulzugangsberechtigungen, Studienabschlüsse und Studienleistungen, die in den Unterzeichnerstaaten erworben wurden, prinzipiell gegenseitig anerkennen zu wollen (zusammenfassend als Lissabon-Konvention bezeichnet). Bei solchen Anerkennungen stecken aufgrund unterschiedlicher Bildungssysteme die Schwierigkeiten natürlich im Detail. Eine zentrale Einschränkung ist bspw., dass die zuständigen Behörden eines Landes sich vorbehalten dürfen, erbrachte Leistungen selbst zu bewerten und auch nur diese Bewertung anerkennen müssen. So kann z.B. entschieden werden, dass vor der Einschreibung in einen Studiengang in einem anderen Land erst noch weitere Zusatzqualifikationen erbracht werden müssen (z.B. vorbereitende Kurse, Aufnahmeprüfungen). Um die Vergleichbarkeit von Leistungen zu erleichtern, beschlossen 1999 29 europäische Länder, die Hochschulstrukturen in Europa zu harmonisieren bzw. besser aneinander anzupassen (zusammenfassend als Bologna-Prozess bezeichnet; Bologna-Erklärung, 1999). Das stieß eine ganze Reihe an Entwicklungen an, die sich natürlich je nach Ausgangslage zwischen den europäischen Ländern unterschieden.

Eine zentrale Veränderung ist, dass europaweit eine Studienstruktur umgesetzt wurde bzw. immer noch wird, die drei Zyklen der Hochschulbildung umfasst (KMK, 2016, 2003; HRK, 2004): im ersten Schritt den Erwerb einer Bachelor-Qualifikation, im zweiten eine Master-Qualifikation und im dritten Schritt ein Promotionsstudium. Jeder Zyklus endet mit einem definierten, eigenen Abschluss. Um den nötigen Umfang für die ersten beiden Abschnitte zu definieren, wurde das European Credit Transfer System entwickelt (dies ist der Ursprung der ECTS-Punkte an Hochschulen). Für deutsche Hochschulen bedeutete dies eine relativ große Umstellung, die nun – für die meisten Hochschulen erstmals – neue, zwei-stufige Studienprogramme entwickeln mussten, eben die besagten Bachelor- und Masterstudiengänge (Pietzonka, 2014; vgl. Klomfaß, 2011; Brändle, 2010). Zuvor existierten bspw. mit den Diplom-Studiengängen an vielen Universitäten Programme, in denen ein Abschluss erst am Ende eines längeren einphasigen Studienverlaufs erworben werden konnte (in diesem Sinne waren sie also nicht gestuft) und die auch nicht unbedingt kompatibel mit den beschlossenen Studienumfängen nach dem ECTS-System waren. Auch, wenn man sagen kann, dass der Großteil aktueller Studienprogramme in Deutschland diesem Zyklus-Modell entspricht (HRK, 2023), gibt es noch einige Bereiche, in denen bisher nur wenige Umstellungen erfolgt sind (vgl. Schütz & Röbken, 2019). Das gilt z.B. für Jura- und Medizin-Studiengänge, die immer noch weitestgehend dem Staatsexamensmodell folgen (HRK, 2023; vgl. Konzen, 2010). Hauptziel dieser Veränderungen auf formaler Ebene war natürlich, dass die Anerkennung von Hochschulqualifikationen vereinfacht wird. Damit verbunden waren und sind allerdings auch eine Reihe weiterer, damit zusammenhängender Ziele, wie die Erleichterung der Mobilität von Studierenden und Absolvent*innen (z.B. Wechsel des Studienorts in ein anderes Land, Auslandssemester), die europaweit gemeinsame Entwicklung und Arbeit an Qualitätsstandards für Studiengänge oder auch das Ziel, mehr Personen außerhalb Europas als Studierende zu gewinnen (vgl. Gehmlich, 2013; Brändle, 2010).

Was wird kritisiert?

Heinz-Peter Meidinger bezieht sich in seiner so bezeichneten dritten Todsünde der Schulpolitik auf diesen Veränderungsprozess im Hochschulbildungssystem, auch wenn dies streng genommen keinen direkten Einfluss auf das Schulsystem in Deutschland hat (ob es einen indirekten Einfluss hat bzw. haben sollte, ist allerdings eine diskutierte Streitfrage, vgl. Klomfaß, 2013). Er nennt die Einführung als Beispiel für eine „weitgehend misslungene Reform“ (Meidinger, 2021, 58) und gibt hierfür folgende Gründe an:

  1. Die Studienzeiten von Studierenden hätten sich nicht verkürzt, weil die meisten Bachelorabsolvent*innen auch ein Masterstudium begönnen. Dies läge auch an schlechten Berufs- und Verdienstaussichten nur mit einem Bachelorabschluss.
  2. Die Mobilität Studierender, einen Teil ihres Studiums im Ausland zu absolvieren (Auslandssemester) hätte nicht zugenommen.
  3. In Bachelorstudiengängen würde ein größerer Anteil Studierender ihr Studium abbrechen, als in nicht-gestuften Studiengängen vor dem Bologna-Prozess.
  4. Über die Qualität gestufter Studiengänge „gibt es vielfach Klagen“ (Meidinger, 2021, 59).

Anzumerken ist, dass die Verkürzung der Studienzeiten (Grund 1) und die Verringerung von Studienabbrüchen (Grund 3) kein offizielles Ziel des Bologna-Prozesses sind, mit dem ja primär die verbesserte gegenseitige Anerkennung und Harmonisierung von Hochschulqualifikationen angestrebt wird. Sie finden sich zumindest nicht als Zielformulierungen in der Bologna-Erklärung selbst (Bologna-Erklärung, 1999) und auch nicht in den selbst formulierten Zielen der (jeweiligen) Bundesregierungen, die die Umsetzung jeweils fortgeführt haben (vgl. Deutscher Bundestag, 2021). Das hat auch mich zunächst überrascht, da in Presseberichten über den Bologna-Prozess zu verschiedenen Zeiten insbesondere die Verkürzung der Studienzeit wie selbstverständlich als Ziel genannt wird (vgl. Winter, 2018; Zeit Online, 2014). Diese Diskrepanz lässt sich wahrscheinlich durch zwei Aspekte erklären, wie die Einführung der gestuften Studiengänge in Deutschland ausgestaltet wurde (HRK, 2008; 2004). Der erste Aspekt ist die vereinbarte Rahmenkonzeption der für Deutschland damals neuen Bachelor-Studiengänge. Bspw. wurde in einem Beschluss der KMK (2003) (bezeichnet als „10 Thesen zur Bachelor- und Masterstruktur in Deutschland“) formuliert:

„Als Regelabschluss eines Hochschulstudiums setzt der Bachelor ein eigenständiges
berufsqualifizierendes Profil voraus, das durch die innerhalb der Regelstudienzeit zu
vermittelnden Inhalte deutlich werden muss.“

KMK (2003, 2)

Ein Bachelor wurde also konzeptuell als Abschluss für ein eigenständig qualifizierendes Studienprogramm gedacht. Kombiniert mit den europäisch beschlossenen ECTS-Vorgaben zum Umfang, die einer Regelstudienzeit von drei bis maximal vier Jahren entsprechen, wurde dies im Vergleich zu den vorher an den Universitäten verbreiteten Abschlüssen, die erst nach längeren Regelstudienzeiten erworben werden sollten, als Verkürzungsziel interpretiert (z.B. Banscherus et al., 2009). Dabei wird aber implizit angenommen, dass ein Bachelorstudium genau die gleichen Qualifikationen ermöglichen müsste, wir z.B. ein Diplomstudiengang. Der zweite Aspekt könnte darin liegen, dass in Deutschland schon vor dem Bologna-Beschluss die Einrichtung konsekutiver, also gestufter Studiengänge vorgeschlagen wurde, und die Verkürzung der Studienzeit und damit verbunden, die frühere Verfügbarkeit von Absolvent*innen auf dem Arbeitsmarkt, dabei als potentieller Vorteil benannt wurde (vgl. Brändle, 2010; Terbuyken, 2002). An diese Argumentationen schloss sich bspw. auch die KMK (2003) an, indem formuliert wurde, dass gestufte Studiengänge „zu kürzeren Studienzeiten, deutlich höheren Erfolgsquoten sowie zu einer nachhaltigen Verbesserung der Berufsqualifizierung und der Arbeitsmarktfähigkeit der Absolventen bei[tragen]“ (KMK, 2003, 2) würden. Direkt als Ziel oder Gestaltungsbedingung formuliert wird aber einer Verkürzung nicht. Auch eine Verringerung von Abbruchquoten als Ziel wird nur indirekt angedeutet. Generell gilt aber, dass – wie es für komplexe Veränderungsprozesse auf Systemebene typisch ist – Ziele generell eher weit und diffus formuliert werden (vgl. Klomfaß, 2011; Brändle, 2010). Der ökonomische Fokus auf den Erwerb von Berufsfähigkeit und schnelleren Abschlüssen ist an sich kein primäres Ziel des Bologna-Prozesses, sondern wurde eher in konkreten der Ausgestaltung in Deutschland zum Thema (vgl. Teichler, 2011). Da mit der Entwicklung von Bachelorstudiengängen, auch eine große inhaltliche Neu-Konzeption angestrebt wurde, ist aber zumindest diskutierbar, inwiefern ein Vergleich von Studienzeiten und Abbruchquoten ein geeignetes Maß für den Erfolg von Veränderungen im Hochschulsystem ist.

Die Erhöhung der Mobilität im (und nach) dem Hochschulstudium (Grund 3) ist hingegen auch ein offizielles Ziel des Bologna-Prozess (vgl. Deutscher Bundestag, 2021). Dass über die Qualität von Studiengängen geklagt würde (Grund 4), ist aus meiner Sicht kein besonderes Merkmal für gestufte Studiengänge. Klagen über die Qualität von Studiengängen treten unabhängig von der Struktur auf Systemebene so gut wie immer auf und Klagen können sich auf die unterschiedlichsten Aspekte beziehen. Sind es die z.B. Breite des Veranstaltungsangebots, die Prüfungs-Belastung oder die Studienbedingungen (vgl. Schulmeister & Metzger, 2011)? Trotz dieser Unklarheiten bzgl. der vier genannten Gründe, lässt sich zusammenfassend festhalten, dass die von Heinz-Peter Meidinger genannten Kritikpunkte im Zuge des Bologna-Prozesses auch schon vielfach genannt wurden bzw. an verschiedenen Stellen in ähnlicher Form aufgetreten sind (z.B. Winter, 2018; Kühl, 2018; Banscherus et al., 2009). Im Folgenden werden wir daher einen Blick darauf werfen, welche Erkenntnisse aus der empirischen Bildungsforschung die genannten Vermutungen stützen oder nicht. Dabei konzentrieren wir uns auf Forschungen für den deutschen Hochschulkontext, auf den sich auch Heinz-Peter Meidinger bezieht. Anzumerken ist zunächst, dass die Forschungs- und Quellenlage zum Bologna-Prozess eher unübersichtlich und diffus ist. Im Folgenden kann daher auch nur ein kurzer Überblick gegeben werden. Dabei orientiere ich mich in der Reihenfolge an den Thesen von Heinz-Peter Meidinger. Sollten Untersuchungen nicht dabei sein, die aber zur Beurteilung der angesprochenen Kritikpunkte zentral sein, freue ich mich über eine kurze Benachrichtigung per E-Mail..

Gut Ding will Weile haben

Welchen Einfluss hatte die Einführung gestufter Studiengänge auf die Zeit, die Studierende bis zum Studienabschluss aufwenden? Um diese Frage zu beantworten, muss zunächst festgelegt werden, was genau mit Studienzeit gemeint ist. Zum einen kann damit der Zeitraum betrachtet werden, die Studierende in einem Studiengang verbringen, bspw. wie lange sie von Beginn eines Studiums bis zum Erwerb des Abschlusses benötigen. Aus dieser Perspektive wird Studienzeit innerhalb eines Studiengangs betrachtet (z.B. ob Studierende einen Bachelorabschluss in kürzerer oder längerer Zeit als die Regelstudienzeit erwerben). Zum anderen kann damit der Zeitraum gemeint sein, den eine Person insgesamt benötigt, bis sie die gesamte, individuelle Hochschulausbildung abgeschlossen hat. Nach dieser Perspektive könnte die Studienzeit bspw. die gesamte benötigte Zeit für ein Bachelor- und ein zusätzliches nachfolgendes Masterstudium bis zum Abschluss umfassen. Personen, die nach dem Bachelorstudium kein Masterstudium anschließen, hätten in dieser Perspektive also eine kürzere Studienzeit. Je nach Perspektive, würde ein Vergleich der „neuen“ gestuften Studiengänge mit den „alten“ einphasigen Studiengängen ein etwas anderes Vorgehen erfordern. Bzgl. der ersten Perspektive könnte man für einen Vergleich prüfen, wie stark die Studierenden im Durchschnitt von der jeweils vorgesehenen Studienzeit abweichen. Bzgl. der zweiten Perspektive könnte man die durchschnittliche Gesamtzeit der individuellen Hochschulausbildung betrachten und prüfen, inwiefern sie sich zwischen den Strukturen unterscheiden.

Welche Erkenntnisse zur Studienzeit bzgl. der Veränderungen der Studienstrukturen liegen vor? Laut dem aktuellsten nationalen Bildungsbericht von 2022, der sich auf Daten der amtlichen Statistik bezieht, schließt ein Drittel der Studierenden ein Studium in Regelstudienzeit ab (Autor:innengruppe Bildungsberichterstattung, 2022). Die meisten Bachelorstudiengänge an Universitäten haben eine Regelstudienzeit von sechs Semestern (vgl. HRK, 2023), der Abschluss wird allerdings nach durchschnittlich 7,9 Semestern erreicht. Dabei hat sich die durchschnittliche Studiendauer bis zum Bachelorabschluss hin zu längeren Zeiten entwickelt. Von im Jahr 2006 im Durschnitt 6,9 Semestern, über 6,5 Semester in 2010, 7,2 im Jahr 2014 und 7,8 Semester im Jahr 2014 (Autor:innengruppe Bildungsberichterstattung, 2022; 2020; 2018; 2016). An Hochschulen für angewandte Wissenschaften (HAW) erwerben Studierende nach durchschnittlich 7,5 Semestern einen Bachelorabschluss, dort beträgt die Regelstudienzeit aber meist zwischen sieben und acht Semestern (Autor:innengruppe Bildungsberichterstattung, 2022; vgl. HRK, 2023). Dabei bestehen große Unterschiede zwischen den Studierenden unterschiedlicher Fächergruppen. So ist bspw. der Anteil an Studierenden in Regelstudienzeit in den Fächergruppen Medizin und Wirtschafts-, Rechts- und Sozialwissenschaften höher (Autor:innengruppe Bildungsberichterstattung, 2022; Online-Anhang). Bspw. untersuchte Dietrich (2016) bspw. den längsschnittlichen Studienverlauf von Lehramtsstudierenden an der Universität Leipzig mit Studienbeginn ab Wintersemester 2006/2007 (n=342, Staatsexamen) und 2007/2008 (n=208, Bachelor- und Masterstudiengänge). Dabei ergab sich, dass 46,6% der Studierenden der Bachelor- und Masterstudiengänge ihr Studium in Regelstudienzeit absolvierten, im Vergleich zu 1,2% der Studierenden in den Staatsexamensstudiengängen. Die durchschnittliche Überschreitung betrug im Staatsexamen 3,3 Semester, im Bachelor-Master-System 1,1 Semester.

Hat sich durch die Einführung von gestuften Bachelor- und Masterstudiengängen nun die Zahl von Studierenden erhöht, die länger als die geplante Regelstudienzeit brauchen? Grundsätzlich war es auch vor der Bologna-Reform so, dass ein hoher Anteil Studierender für die einphasigen Studiengänge eine längere Zeit benötigte, als in den Studienplänen vorgesehen. In einer Untersuchung des Wissenschaftsrates zur Entwicklung der Fachstudiendauer an Universitäten von 1990 bis 1998 wird bspw. konstatiert, „daß unter den 132 Diplom- (U), Diplom- (KH) und
Magisterstudiengängen […], nur 11 Studiengänge einen Absolventenanteil innerhalb der Höchstförderungsdauer des BAföG von über 50 % erreichen. In 74 Studiengängen hat auch 2 Semester später noch nicht die Hälfte der Absolventen ihr Studium beendet. In 76 Studiengängen liegt der Median der Fachstudiendauer um mehr als 2 Semester über der Höchstförderdauer.“
(Wissenschaftsrat, 2001, 10f.). Anzumerken ist, dass als Höchstförderungsdauer gemäß BAföG (Bundesausbildungsförderungsgesetz) zum damaligen Zeitpunkt meist die Regelstudienzeit inklusive einem weiteren Semester angenommen wurde. Bzgl. der Studiendauer bezogen auf die Regelstudienzeit hat sich also durch die Einführung der „neuen“ Studiengänge grundsätzlich eher wenig verändert. Dass Studiengänge nicht in der formal geplanten Zeit beendet werden, ist also ein Phänomen, dass auch vor der Bolognareform schon verbreitet war.

Wie hat sich durch die Einführung der gestuften Studiengänge aber auf die Gesamtstudierdauer ausgewirkt? Generell gilt: an Universitäten nehmen gut zwei Drittel der Studierenden nach dem Bachelorabschluss ein Masterstudium auf (eine so genannte Übergangsquote von ca. 66% für den Prüfungsjahrgang 2018; Autor:innengruppe Bildungsberichterstattung, 2022). Auf Basis von Daten der amtlichen Statistik haben Studierende an Universitäten im Jahr 2000 ein Diplomstudium nach durchschnittlich 12,7 Semestern abgeschlossen (Autor:innengruppe Bildungsberichterstattung, 2016), für den Abschluss eines Masters betrug die gesamte durchschnittliche Studiendauer bspw. 11,2 Semester im Jahr 2012, 12,1 Semester im Jahr 2016 und 13,3 Semester im Jahr 2020 (Autor:innengruppe Bildungsberichterstattung, 2016; 2020; 2022). Für noch bestehende Diplomstudiengänge betrug die Studiendauer im Jahr 2018 im Durchschnitt übrigens 12,7 Semester (Autor:innengruppe Bildungsberichterstattung, 2020). Ähnliches gilt auch spezifisch nur für Lehramtsstudiengänge. Im Jahr 2000 machten Lehramtsstudiengänge im Durchschnitt nach 11,4 Semestern einen Abschluss, im Jahr 2014 nach 11,2 Semestern (Autor:innengruppe Bildungsberichterstattung, 2016) und 11,6 Semester im Jahr 2018 (Autor:innengruppe Bildungsberichterstattung, 2020), wobei hier natürlich Lehramtsstudiengänge für alle Zielschulformen zusammengefasst sind (z.B. Grundschule und berufliche Schulen). Auch ältere Untersuchungen zeigen schon ähnliche Studienzeiten für die einphasigen Studiengänge (z.B. Wissenschaftsrat, 2001).

Bildnachweis: Autor:innengruppe Bildungsberichterstattung, 2022, 212; lizenziert unter CC-BY-SA 3.0 DE

Generell ist es also so, dass sich nach der Einführung der „neuen“ Studiengänge, die Gesamtstudiendauern kaum verändert haben, mit einer Tendenz zu längeren Zeiten in den letzten sechs Jahren. Die Unterschiede zwischen Studiengängen und Fächern innerhalb der einzelnen Studienformen sind meist größer, als die Unterschiede zwischen der Studienzeit verschiedener Abschlussarten. Wie man diesen Umstand bewertet, ist eine Frage der Erwartung. Die Studiendauer bis zum Bachelorabschluss ist kürzer als z.B. zum Diplom. Heinz-Peter Meidinger stimme ich insofern zu, als dass zumindest an Universitäten die meisten Studierenden auch einen Masterabschluss zusätzlich anstreben und sich kombiniert keine Veränderung der mittleren Studienzeit ergeben hat. Das war aber auch zumindest kein offizielles Ziel des Bologna-Prozesses.

Was bringt der Bachelor?

Liegen die Gründe dafür, dass die meisten Studierenden mit einem Bachelorabschluss auch ein Master-Studium beginnen an schlechten Berufs- und Verdienstaussichten? Auch zu dieser Frage liegen einige Ergebnisse empirischer Untersuchungen vor. Auch hier können zunächst Analysen auf Basis amtlicher statistischer Daten herangezogen werden. Grundsätzlich ist es so, dass Personen mit einem Hochschulabschluss (egal welcher), im Durchschnitt höhere Einkommen erzielen, seltener von Arbeitslosigkeit betroffen sind und häufiger Führungspositionen ausüben als Personen mit einem anderen beruflichen Qualifikationsnachweis (Autor:innengruppe Bildungsberichterstattung, 2018). Um Unterschiede im beruflichen Verbleib nach Abschlussart abzubilden, wird bspw. im Bildungsbericht 2022 unterschieden, welches Anforderungsniveau ausgeübte Berufe erfordert. Dabei wird zwischen Expert*in, Spezialist*in, Fachkraft und Helfer*in differenziert. Das Anforderungsniveau Expert*in und Spezialist*in werden dabei als ausbildungsadäquate Berufsplatzierung für Personen mit Hochschulabschluss betrachtet. Dabei zeigt sich, dass 85% der Absolvent*innen in einem Beruf arbeiten, die dem ausbildungsadäquaten Anforderungsniveau entspricht, mit Masterabschluss sind es 89%, mit „nur“ Bachelorabschluss sind es 80% (Autor:innengruppe Bildungsberichterstattung, 2022, 217). Es gibt also bzgl. dieses Maßstabs einen, allerdings kleinen, Unterschied.

Unterschiede zeigen sich auch bzgl. des von Absolvent*innen mit verschiedenen Studienabschlüssen erzielten Einkommens. Bspw. nutzten Neugebauer & Weiss (2017) Daten des Mikrozensus 2010 und 2013 und betrachteten insbesondere Berufseinsteiger*innen, also Hochschulabsolvent*innen, deren Abschluss maximal sechs Jahre zurücklag. Diese Gruppen wurden auch mit Personen verglichen, die anderweitig Qualifikationen erworben haben (z.B. Ausbildung, Meister). Je nach Analyseschwerpunkt ergab sich eine Stichprobe zwischen von N =30.137 bis 34.940 Personen. In Regressionsanalysen zeigte sich, dass Masterabsolvent*innen unter Kontrolle der Fachdomäne ein signifikante höheres monatliches Einkommen angaben als Bachelorabsolvent*innen (ca. 14%). Diese gaben aber ein höheres Einkommen als Personen mit Ausbildungsabschlüssen an, mit Meisterabschluss war das Einkommen ähnlich hoch. Abschlüsse von HAWs gingen mit etwas höheren Einkommen einher als die Äquivalente von Universitäten. Ein ähnliches Muster ergab sich bzgl. des empfundenen Berufsprestiges mit etwas geringeren Unterschieden. Bachelorabsolvent*innen von Universitäten hatten aber die größte Wahrscheinlichkeit, von Arbeitslosigkeit betroffen zu sein und befristete Arbeitsverträge zu erhalten.

Trennt (2019) untersuchte anhand von Daten der ersten Befragungswelle des Deutsches Zentrum für Hochschul- und Wissenschaftsforschung (DZHW), inwiefern sich Unterschiede im nach Angaben der Absolvent*innen (N=2043) im weiteren Berufsverlauf erzielten Einkommen durch die Art ihres Studienabschlusses (Bachelor- oder Masterabschluss) erklären lassen. Im Nullmodell der Regressionsanalysen ergab sich, dass die Art des Abschlusses ein signifikanter Prädiktor ist (MA-Absolvent*innen verdienten nach Eigenangabe ca. 14% mehr), aber allein nur 2,8% der Varianz aufklärt. Werden weitere Variablen kontrolliert, die das erzielte Einkommen ebenfalls erklären können (z.B. Arbeitsort, Branche, vorherige Ausbildung, BA- bzw- MA-Note, Arbeitsmarktstruktur, Ausbildungsadäquanz, Fach u.v.a.), vergrößert sich der Unterschied zwischen den Absolvent*innengruppen sogar noch etwas (ca. 16% Einkommensunterschied). Insgesamt werden durch alle einbezogenen Variablen 36,7% der Unterschiede erklärt. Dabei wird deutlich, dass Einkommensunterschied durch ein komplexes Zusammenwirken vieler Faktoren erklärt werden kann. „Demnach verdienen Bachelorabsolventinnen und -absolventen auch deswegen weniger, weil sie häufiger Tätigkeiten ausüben, für die sie überqualifiziert sind.“ (Trennt, 2019, 391; vgl. auch Grotheer, 2019). Ob dies aber z.B. daran liegt, dass BA-Absolvent*innen ihre Tätigkeiten eher zur Überbrückung zum Masterstudium ausüben, konnte durch die Daten nicht geklärt werden.

Ähnliche Unterschiede zwischen beiden Absolvent*innengruppen werden auch in anderen Untersuchungen berichtet (Hall, 2021; Fabian et al., 2016; Spangenberg & Quast, 2016; Konegen-Grenier, Placke & Schröder-Kralemann, 2015). Auch Analysen, in denen Studierenge mit „alten“, einphasigen Diplomabschlüssen einbezogen wurden, zeigen, dass Bachelorabsolvent*innen im Vergleich geringere Einkommen erzielen (Rehn et al., 2011), wobei die Größe des Unterschieds stark von den studierten Fächern abhing (Müller & Reimer, 2015). Zu beachten ist bei diesen Ergebnissen allerdings auch, dass im Zeitverlauf zum anderen der Anteil von Berufsanfänger*innen, die einen Hochschulabschluss erworben hat, insgesamt gestiegen ist (Autor:innengruppe Bildungsberichterstattung, 2022, 77f.), also insgesamt mehr Personen mit einem solchen Abschluss auf dem Arbeitsmarkt nach Stellen suchen. Dementsprechend werden nun auch vermehrt Personen mit „neuen“ Abschlüssen eingestellt (Briedis et al., 2011). Daher können sich Ergebnisse auch im Zeitverlauf ändern bzw. Erkenntnisse zum „Wert“ von Abschlüssen hängen natürlich auch davon ab, in welchen Jahren der Abschluss erworben wurde. Basierend auf den vorliegenden Untersuchungen sind die Verdienst- und Beschäftigungsaussichten von reinen Bachelorabsolvent*innen aber tatsächlich etwas schlechter als von Absolvent*innen mit anderen Hochschulabschlüssen, wie auch Heinz-Peter Meidinger impliziert.

Ist dieser Unterschied aber auch ein Grund für Studierende, nach dem Bachelorabschluss eher ein Masterstudium aufzunehmen (vgl. Johnson, 2013)? Zur Frage, aus welchen Motiven heraus Studierende ein Studium aufnehmen, liegen auch einige empirische Erkenntnisse vor. Lörz et al. (2019) untersuchten mit Hilfe von Daten des DHZW-Studienberechtigtenpanels (N=2667 Personen, die 2010 die Studienberichtigung erworben haben), wie bestimmte motivationale Orientierungen, Zielvorstellungen und die Entscheidung, nach einem Bachelorabschluss ein Masterstudium aufzunehmen zusammenhängen. Dabei wurde zu verschiedenen Zeitpunkten eine Reihe von Variablen erfasst (z.B. Schul- und Studienleistungen, eingeschätzte Kosten, erwartete immaterielle und materielle Erträge, Merkmale der Bildungsbiografie, familiäre Rahmenbedingungen etc.). In logistischen Regressionsanalysen ergab sich, dass viele dieser Merkmale signifikante Prädiktoren für die Entscheidung für ein Masterstudium bilden, allerdings meist mit einem ähnlich kleinen Effekt. Die größten Effekte hatten das studierte Fach (Lehramt, Natur- und Ingenieurswisseschaften) und ob der Bachelor an einer Universität erworben wurde. Erwartete Opportunitätskosten hatten nur einen eher kleinen Effekt auf die Entscheidung gegen ein Masterstudium im Anschluss (β=-0,02). Diese komplexe Motivlage für das Aufnehmen eines Masterstudiums wird auch in anderen Untersuchungen herausgestellt (z.B. Köck & Zach, 2022; Kretschmann et al., 2017; Lörz et al., 2015; Auspurg & Hinz, 2011). Die geringen Verdienstaussichten allein sind für die meisten Studierenden daher anscheinend nicht der ausschlaggebendste Grund bzw. es hängt sehr stark vom studierten Fach ab, wie sehr dieses Motiv ein Grund ist.

Für das Lehramtsstudium, mit dem wir uns hier im Blog hauptsächlich beschäftigen, ist es relativ klar, warum sich die meisten Studierenden mit einem Bachelorabschluss auch für ein Masterstudium entscheiden (ca. 90%; Autor:innengruppe Bildungsberichterstattung, 2018). In allen Bundesländern berechtigt schlicht nur ein Masterabschluss zur Aufnahme des Vorbereitungsdiensts bzw. des Referendariats (vgl. Möller, Bauer & Zimmermann, 2023). Aufgrund dieses Umstands wurde und wird auch für das Lehramtsstudium weiterhin diskutiert, wie eine gestufte Studienstruktur am besten ausgestaltet werden, wie diese verändert werden sollte (vgl. Schmees, 2020; Helsper & Kolbe, 2002; Herrmann, 2001). Übrigens nehmen auch nach erfolgreichem Masterstudium nicht alle Lehramtsstudierenden den Vorbereitungsdienst auf. Bei Analysen auf Basis des Nationalen Bildungspanels konnten Gülen, Müller & Schmid-Kühn (2023) feststellen, dass nach dem Masterabschluss 16% der Lehramtsabsolvent*innen einen Beruf außerhalb des Lehramtes ausüben oder ein Promotionsstudium aufnehmen.

So weit, so gut…

In diesem Beitrag haben wir uns mit der ersten Begründung Heinz-Peter Meidingers, warum er die Einführung von Bachelor- und Masterstudiengängen als eine nicht gelungene Reform nennt, aus der Perspektive der empirischen Bildungsforschung beschäftigt. Aus Gründen des Umfangs und für eine bessere Lesbarkeit werden die übrigen drei Gründe bzw. Thesen (keine Erhöhung der internationalen Mobilität im Studium, höhere Abbruchquoten, Klagen über Qualität) im vierten und letzten Teil zu seiner Todsünde der Schulpolitik Nr. 3 betrachtet. Er findet sich hier.

Literatur:

  • Autor:innengruppe Bildungsberichterstattung (2016). Bildung in Deutschland 2016 – Ein indikatorengestützter Bericht mit einer Analyse zu Bildung und Migration. wbv. (Online)
  • Autor:innengruppe Bildungsberichterstattung (2018). Bildung in Deutschland 2018 – Ein indikatorengestützter Bericht mit einer Analyse zu Wirkungen und Erträgen von Bildung. wbv. (Online)
  • Autor:innengruppe Bildungsberichterstattung (2020). Bildung in Deutschland 2020 – Ein indikatorengestützter Bericht mit einer Analyse zu Bildung in einer digitalisierten Welt. wbv. (Online)
  • Autor:innengruppe Bildungsberichterstattung (2022). Bildung in Deutschland 2022 – Ein indikatorengestützter Bericht mit einer Analyse zum Bildungspersonal. wbv. (Online)
  • Auspurg, K., & Hinz, T. (2011). Master für alle? Der Einfluss sozialer Herkunft auf den Studienverlauf und das Übertrittsverhalten von Bachelorstudierenden. Soziale Welt, 62(1), 75-99. (Online)
  • Banscherus, U., Gulbins, A., Himpele, K., & Staack, S. (2009). Der Bologna-Prozess zwischen Anspruch und Wirklichkeit – Die europäischen Ziele und ihre Umsetzung in Deutschland – Eine Expertise im Auftrag der Max-Traeger-Stiftung. GEW. (Online)
  • Bologna-Erklärung (1999). Der Europäische Hochschulraum – Gemeinsame Erklärung der Europäischen Bildungsminister Juni 1999. Bologna. (Online)
  • Brändle, T. (2010). 10 Jahre Bologna-Prozess. Springer VS. (Online)
  • Briedis, K., Heine, C. Konegen-Grenier, & Schröder A-K. (2011). Mit dem Bachelor in den Beruf – Arbeitsmarktbefähigung und -akzeptanz von Bachelorstudierenden und -absolventen. Stifterverband für die Deutsche Wissenschaft. (Online)
  • Briedis, K., Klüver, S., & Trommer, M. (2016). Zwischen Etablierung, Stabilisierung und Aufstieg: Berufliche Entwicklung der Hochschulabsolvent(inn)en 2009. Forum Hochschule 4|2016. DZHW. (Online)
  • Deutscher Bundestag (Hrsg.) (2021). Bericht der Bundesregierung über die Umsetzung der Ziele des Bologna-Prozesses 200 bis 2020. Drucksache 19/27965. (Online)
  • Dietrich, S. (2016). Lehrerbildung in Sachsen–modularisiert zum Erfolg? Effektivität der Bachelor/Master-Lehrerausbildung am Beispiel der Universität Leipzig. DDS–Die Deutsche Schule108(1), 93-106. (Online)
  • Fabian, G., Hillmann, J., Trennt, F. & Briedis, K. (2016). Hochschulabschlüsse nach Bologna. Werdegänge der Bachelor- und Masterabsolvent(inn)en des Prüfungsjahrgangs 2013. Forum Hochschule 1|2016. DZHW. (Online)
  • Gehmlich, V. (2013). Die Bologna Reform–Ein europäischer Hochschul(t)raum?. In S. Claus, & M. Pietznonka (Hrsg.), Studium und Lehre nach Bologna: Perspektiven der Qualitätsentwicklung (S. 97-106). Springer. (Online)
  • Grotheer, M. (2019). Berufseinstieg und Berufsverlauf mit Bachelorabschluss. Wie erfolgreich etablieren sich Graduierte verschiedener Abschlussarten am Arbeitsmarkt?. In M. Lörz, & H. Quast (Hrsg.), Bildungs-und Berufsverläufe mit Bachelor und Master: Determinanten, Herausforderungen und Konsequenzen (S. 437-479). Springer. (Online)
  • Gülen, Ș., Müller, K., & Schmid-Kühn, S. M. (2023). Lehramtsstudium–Vorbereitungsdienst–Lehrkräfteberuf, oder? Empirische Analysen aus dem Nationalen Bildungspanel (NEPS). ZeHf–Zeitschrift für empirische Hochschulforschung6(2), 149-168. (Online)
  • Hall, A. (2021). Alles beim Alten? Bildungserträge höherer beruflicher und akademischer Abschlüsse vor und nach Bologna. KZfSS Kölner Zeitschrift für Soziologie und Sozialpsychologie, 73(4), 527-553. (Online)
  • Helsper, W., & Kolbe, F. U. (2002). Bachelor/Master in der Lehrerbildung—Potential für Innovation oder ihre Verhinderung?. Zeitschrift für Erziehungswissenschaft5, 384-400. (Online)
  • Herrmann, U. (2001). Eine Bachelor-/Master-Struktur für das Universitätsstudium von Gymnasiallehrern. Chancen oder Holzwege?. Zeitschrift für Pädagogik47(4), 559-575. (Online)
  • HRK (Hrsg.) (2004). Bologna-Reader – Texte und Hilfestellungen zur Umsetzung der Ziele des Bologna-Prozesses an deutschen Hochschulen. HRK-Servicestelle Bologna. (Online)
  • HRK (Hrsg.) (2008). Bologna-Reader III – FAQs – Häufig gestellte Fragen zum Bologna-Prozess an deutschen Hochschulen. HRK-Bologna Zentrum. (Online)
  • HRK (Hrsg.) (2023). Statistische Daten zu Studienangeboten an Hochschulen in Deutschland -Studiengänge, Studierende, Absolventinnen und Absolventen – Wintersemester 2023/2024. HRK. (Online)
  • Johnson, M. T. (2013). The impact of business cycle fluctuations on graduate school enrollment. Economics of Education Review34, 122-134. (Online)
  • Kaufmann, B., & Fraij, A. (2013). Studienqualität vor dem Hintergrund des Bologna-Prozesses: ein Vergleich der Studienqualität zwischen Diplom-, Bachelor-und Masterstudierenden der erziehungswissenschaftlichen Studiengänge an der Universität Gießen – Eine querschnittliche Analyse. Institut für Erziehungswissenschaft, Universität Gießen. (Online)
  • Klomfaß, S. (2011). Hochschulzugang und Bologna-Prozess: Bildungsreform am Übergang von der Universität zum Gymnasium. Springer. (Online)
  • Klomfaß, S. (2013). Der Bologna-Prozess–ein Angriff auf den deutschen Königsweg? Ein Blick auf den Hochschulzugang in Deutschland unter den Bedingungen der Europäischen Bildungsreform. In N. Ricken, H-C. Koller, & E. Keiner (Hrsg.), Die Idee der Universität-revisited. (S. 127-141). Springer. (Online)
  • KMK (2003). 10 Thesen zur Bachelor- und Masterstruktur in Deutschland (Beschluss der Kultusministerkonferenz vom 12.06.2003). (Online)
  • KMK (2016). Europäische Studienreform – Gemeinsame Erklärung von Kultusministerkonferenz und Hochschulrektorenkonferenz (Beschluss der Hochschulrektorenkonferenz vom 10.11.2015 sowie der Kultusministerkonferenz vom 08.07.2016). (Online)
  • Köck, V., & Zach, A. (2022). Wohin geht es nach dem Bachelorabschluss? Einblicke in die Ergebnisse einer Studienabschlussbefragung an der Universität Graz. In A. Eder, K. Deman, & S. Aldrian (Hrsg.), Bildungs-und Berufsvorstellungen von Bachelorabsolventen und-absolventinnen: Empirische Analysen anhand von Befragungs-und Registerdaten (S. 13-34). Springer. (Online)
  • Konegen-Grenier, C., Placke, B., & Schröder-Kralemann, A. K. (2015). Karrierewege für Bachelorabsolventen: Ergebnisbericht zur Unternehmensbefragung 2014. Stifterverband. (Online)
  • Konzen, H. (2010). Bologna-Prozess und Juristenausbildung. Juristenzeitung65(5), 241-245. (Online)
  • Kretschmann, J., Gronostaj, A., Schulze, A., & Vock, M. (2017). Wenn sich die Masterfrage stellt: Soziale Herkunftseffekte auf die Übergangsintention nach dem Bachelorstudium. ZeHf–Zeitschrift für empirische Hochschulforschung1(1), 13-14. (Online)
  • Kühl, S. (2018). Verschulung wider Willen. Die ungewollten Nebenfolgen einer Hochschulreform. In N. Hericks (Hrsg.), Hochschulen im Spannungsfeld der Bologna-Reform: Erfolge und ungewollte Nebenfolgen aus interdisziplinärer Perspektive (S. 295-309). Springer. (Online)
  • Lörz, M., Quast, H., & Roloff, J. (2015). Konsequenzen der Bologna-Reform: Warum bestehen auch am Übergang vom Bachelor-ins Masterstudium soziale Ungleichheiten?. Zeitschrift für Soziologie44(2), 137-155. (Online)
  • Lörz, M., Quast, H., Roloff, J., & Trennt, F. (2019). Determinanten des Übergangs ins Masterstudium. Theoretische Modellierung und empirische Überprüfung. Bn M. Lörz, & H. Quast (Hrsg.), Bildungs-und Berufsverläufe mit Bachelor und Master: Determinanten, Herausforderungen und Konsequenzen (S. 53-93). Springer. (Online)
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Möller, J., Bauer, J., & Zimmermann, F. (2023). Das Lehramtsstudium – Angebot, Nutzung, Lernergebnisse. In T. Kauper, A. Bernholt, J. Möller, & O. Köller (Hrsg.), PaLea: Professionelle Kompetenzen und Studienstrukturen im Lehramtsstudium (S. 149-178). Waxmann.
  • Müller, C., & Reimer, M. (2015). Einkommen von Bachelor und Diplomabsolventen: Die Rolle von Fach und Arbeitsmarkt. Beiträge zur Hochschulforschung, 37(2), 88-114. (Online)
  • Neugebauer, M., & Weiss, F. (2017). Does a Bachelor’s Degree pay off?: Labor Market Outcomes of Academic versus Vocational Education after Bologna. School of Business & Economics Discussion Paper 2017/11. FU Berlin. (Online)
  • Pietzonka, M. (2014). Gestaltung von Studiengängen im Zeichen von Bologna. Springer. (Online)
  • Rehn, T., Brandt, G., Fabian, G., & Briedis, K. (2011). Hochschulabschlüsse im Umbruch. Studium und Übergang von Absolventinnen und Absolventen reformierter und traditioneller Studiengänge des Jahrgangs 2009. HIS:Forum Hochschule 17|2011. HIS. (Online)
  • Spangenberg, H., & Quast, H. (2016). Bildungsentscheidungen und Umorientierungen im nachschulischen Verlauf. Dritte Befragung der Studienberechtigten 2010 viereinhalb Jahre nach Schulabschluss. Forum Hochschule 5|2016. DZHW. (Online)
  • Schmees, J. K. (2020). Lehrer* innenbildung und Bologna-Prozess: Politische Strategien zur Einführung der Bachelor-und Masterabschlüsse im Bundesländervergleich. Julius Klinkhardt. (Online)
  • Schütz, M., & Röbken, H. (2018). Präventives Reformieren. Wie und warum „Gallische Dörfer “an Hochschulen das Bologna-Studium ablehnen. N. Hericks (Hrsg.), Hochschulen im Spannungsfeld der Bologna-Reform: Erfolge und ungewollte Nebenfolgen aus interdisziplinärer Perspektive (S. 335-351). Springer. (Online)
  • Schulmeister, R., & Metzger, C. (Hrsg.). (2011). Die Workload im Bachelor: Zeitbudget und Studierverhalten.: Eine empirische Studie. Waxmann. (Online)
  • Teichler, U. (2011). Der Jargon der Nützlichkeit: Zur Employability-Diskussion im Bologna-Prozess. In B. Hölscher, & J. Suchanek (Hrsg.), Wissenschaft und Hochschulbildung im Kontext von Wirtschaft und Medien (S. 165-186). Springer VS. (Online)
  • Terbuyken, G. (2002). Bedingungen und Chancen für konsekutive Studiengänge – Zur Einführung von Bachelor- und Masterstudiengängen in der Sozialarbeit, Evangelische Jugend, 79(2), 81-94. (Online)
  • Trennt, F. (2019). Zahlt sich ein Master aus? Einkommensunterschiede zwischen den neuen Bachelor-und Masterabschlüssen. In M. Lörz, & H. Quast (Hrsg.), Bildungs-und Berufsverläufe mit Bachelor und Master: Determinanten, Herausforderungen und Konsequenzen (S. 371-397). Springer (Online)
  • Winter, M. (2018). Bologna–die ungeliebte Reform und ihre Folgen. In N. Hericks (Hrsg.), Hochschulen im Spannungsfeld der Bologna-Reform: Erfolge und ungewollte Nebenfolgen aus interdisziplinärer Perspektive (S. 279-293). Springer. (Online)
  • Wissenschaftsrat (Hrsg.) (2001). Entwicklung der Fachstudiendauer an Universitäten von 1990 bis 1998. Wissenschaftsrat. (Online)
  • Zeit Online (Hrsg.) (2014). Bachelor-Abschlüsse dauern länger als geplant, Zeit Online, 27. Juli 2014. (Online)

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 4/12 – Teil 2

Todsünde Nr. 3: Zu viele unausgereifte Reformen im Bildungssystem

In einer Artikelreihe beschäftigen wir uns mit dem Buch Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei betrachten wir, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Grundsätzlich ist daher hilfreich, das entsprechende Buchkapitel gelesen zu haben, was ich auch an dieser Stelle ausdrücklich empfehlen möchte. Dies ist der zweite Teil eines Beitrags, der sich mit der dritten vom Autoren so bezeichneten „Todsünde“ beschäftigt. Thesen aus dem Buch werden im Konjunktiv wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll, sondern einfach den Regeln indirekter Rede folgt. Im ersten Teil wurde die Kernthese des zugehörigen Buchkapitels genauer beschrieben: Zusammengefasst würden im Bildungssystem zu viele Veränderungen vorgenommen, ohne vorher ausreichend erprobt und/oder danach ausreichend evaluiert zu werden. Heinz-Peter Meidinger beschreibt insbesondere drei Beispiele von Reformen, die sich aus seiner Sicht besonders negativ ausgewirkt hätten. Meidingers erstes Beispiel, das Konzept „Lesen durch Schreiben“, haben wir im ersten Teil genauer betrachtet. In diesem Beitrag geht es nun um das zweite Beispiel: den (frühen) Fremdsprachenunterricht in der Grundschule.

Fremdsprachen in der Grundschule?

Noch in seiner Funktion als Präsident des Deutschen Lehrerverbandes hat Heinz-Peter Meidinger im Sommer 2023 in verschiedenen Medien die Abschaffung des Englischunterrichts an Grundschulen vorgeschlagen, um stattdessen mehr Zeit für die Leseförderung bzw. den Deutschunterricht aufzuwenden (z.B. Votja, 2023; BR24, 2023). Den frühen Fremdsprachenunterricht hat der Autor auch schon im vorliegenden Buchkapitel negativ betrachtet und dazu ähnliche Argumente angeführt wie in den aktuelleren Interviews. Heinz-Peter Meidinger kritisiert am Fremdsprachenunterricht in der Grundschule verschiedene Aspekte. Zum Ersten den (eventuell) fehlenden Lernerfolg: Bis heute gibt es keine Evaluation, die belegt, dass durch den frühen Fremdsprachenbeginn die fremdsprachliche Kompetenz von Schulabsolventen gestiegen sei“ (Meidinger, 2021, 57). Stattdessen seien Kompetenzen in der Muttersprache geschwächt worden, weil für den Fremdsprachenunterricht der Zeitrahmen für den Deutschunterricht gekürzt worden sei. Zum Zweiten das Fehlen von Bildungsstandards für das frühe Fremdsprachenlernen, auf denen der Unterricht ein weiterführenden Schulen aufbauen könnte. Nach Aussage von Heinz-Peter Meidinger fingen […] die Fremdsprachenlehrkräfte an Gymnasien deshalb nochmals von vorne an“ (Meidinger, 2021, 58), wobei ich vermute, dass auch Lehrkräfte an anderen weiterführenden Schulformen gemeint sind. Zum Dritten sieht er die Annahme kritisch, dass Kinder Fremdsprachen besonders leicht lernen würden, was wie folgt begründet wird:

Der Lernfortschritt ist bei gleichem Zeiteinsatz bei Zehnjährigen höher als bei Sechs- oder Achtjährigen, weil letztere zu systematischem Lernen noch nicht in der Lage sind“

(Meidinger, 2021, 58).

Ich muss zugeben, dass ich dieses Argument nicht ganz verstehe bzw. nachvollziehen kann. Ich vermute, dass sich Heinz-Peter Meidinger hier auf empirische Untersuchungen bezieht, zu denen leider keine Quellenangaben gemacht werden. Wenn Sechs- bis Achtjährige grundsätzlich nicht zu systematischem Lernen in der Lage wären, spräche das dann nicht generell dafür, die Grundschule erst ab einem Alter von neun Jahren zu beginnen? Ich vermute, dass das nicht der Aussageintention des Autors entspricht, es ließe sich aber allein auf Grundlage seines Textes so interpretieren. Zum Vierten wird von Heinz-Peter Meidinger auch kritisiert, dass zu wenige für den Fremdsprachenunterricht ausgebildete Lehrkräfte vorhanden seien.

Englisch auf Kosten der Erstsprache?

Seit 2004 ist die Teilnahme am fremdsprachlichen Unterricht in allen Bundesländern für alle Kinder in der Grundschule verpflichtend, wobei sich die konkrete Ausgestaltung (z.B. Klassenstufe, Umfang) zwischen den Bundesländern unterscheidet und zudem im Laufe der Zeit auch verändert (vgl. KMK, 2013). In Nordrhein-Westfalen wurde verpflichtender Englischunterricht an allen Grundschulen beispielsweise ab dem Jahr 2003 eingeführt (MSB NRW, 2003), konkret mit jeweils zwei Unterrichtsstunden pro Woche in den Klassenstufen 3 und 4 (MSB NRW, 2005). Ging dies zu Lasten anderer Fächer, […] weil die Zusatzstunden auch aus dem Bereich des Deutschunterrichts herausgebrochen wurden“ (Meidinger, 2021, 57)? In der Stundentafel für die Grundschule vor der Einführung waren für die dritte Klasse 23-24 Stunden pro Woche vorgesehen, von denen 14-15 Stunden auf die Fächer Sprache, Sachunterricht, Mathematik sowie Förderunterricht entfallen sollten (MSB NRW, 1996). Für die vierte Klasse waren es insgesamt 24-25 Wochenstunden, davon 15-16 für die genannten Bereiche, also auch das Fach Deutsch. In der Stundentafel nach Einführung des Englischunterrichts waren für die dritte Klasse 25-26 Stunden pro Woche, davon 14-15 Stunden für die Fächer Deutsch, Sachunterricht, Mathematik, Förderunterricht vorgesehen (MSB NRW, 2005). Der Anteil für das Fach Deutsch änderte sich also nicht. Stattdessen wurde das Fach Englisch mit einer zusätzlichen Erhöhung der Gesamtstundenzahl eingeführt (was auch für Klassenstufe 4 zutrifft). Auch als der Beginn des Englischunterrichts in die Klassenstufe 1 vorverlegt wurde (MSB NRW, 2009), geschah dies im Zuge einer Erhöhung des gesamten Stundenvolumens und ohne Abzüge im Fach Deutsch. In der aktuellen Fassung wurde der Unterrichtsbeginn wieder in Klassenstufe 3 verlegt (MSB NRW, 2021), allerdings mit wöchentlich drei Stunden Englischunterricht verbunden mit einer Erhöhung des gesamten Stundenvolumens (das Gesamtvolumen für Klasse 1 und 2 blieb übrigens unverändert und die nun freien Stunden wurden den Basisfächern zugewiesen). Zumindest für Nordrhein-Westfalen ist die Aussage zur Kürzung auf Kosten des Deutschunterrichts also nicht zutreffend.

Empirische Erkenntnisse zum frühen Fremdsprachenunterricht

Welche Erkenntnisse empirischer Forschung liegen zu den kritisierten Aspekten vor? Wie schon im ersten Teil zu diesem Beitrag möchte ich auch hier zuvor anmerken, dass ich kein Experte für Fremdsprachendidaktik oder Elementarpädagogik bin. Nichtsdestotrotz werden wir die genannten Prämissen und Argumentationen vor dem Hintergrund empirischer Forschungen betrachten. Dabei wird der Fokus auf das Fach Englisch gelegt, da sich die meisten vorliegenden Untersuchungen auf dieses Fach beziehen. Es existieren aber auch Untersuchungen zu anderen Fremdsprachen in der Grundschule (z.B. Peyer et al., 2016; Jung, 2015; Schlemminger, 2011). Modellversuche zum Englischunterricht in der Grundschule wurden in Deutschland schon seit den 60er-Jahren des vorherigen Jahrhunderts durchgeführt (z.B. Doyé & Lüttge, 1977; Kraifl, 1972; vgl. Gompf, 1986) und auch im Zuge der flächendeckenden Einführung deutschlandweit wurden eine Vielzahl von Untersuchungen durchgeführt (vgl. Hempel et al., 2017), teilweise mit dem expliziten Ziel einer Evaluation des frühen Fremdsprachenunterrichts in der Grundschule (z.B. Groot-Wilken & Husfeldt, 2013). In Anlehnung an die Darstellung von Baumert et al. (2020) lassen sich diese Untersuchungen grob danach unterscheiden, ob sie eher die Sprachkompetenzen von Kindern am Ende der Grundschulzeit oder eher die Sprachkompetenzen von Schüler*innen in der Sekundarstufe I (oder sogar Studierenden) untersuchen. Natürlich bestehen zwischen den Untersuchungen Unterschiede, beispielsweise im Studiendesign (z.B. Anzahl der Messzeitpunkte, Stichproben) oder darin, welche Facetten fremdsprachlicher Kompetenzen in den Fokus genommen wurden (z.B. Hörverstehen, Leseverstehen, mündliche Sprachkompetenz, Wortschatz etc.).

Wie gut können“ Schüler*innen am Ende der Grundschule Englisch?

Es liegen mehrere Untersuchungen vor, die längsschnittlich untersucht haben, wie sich die Kompetenzen von Schüler*innen im Fach Englisch im Verlauf der Grundschule verändern bzw. querschnittlich erhoben haben, welche Kompetenzniveaus von Kindern am Ende der Grundschulzeit erreicht werden (vgl. Summer & Böttger, 2022). Bei den meisten Untersuchungen hatte der Englischunterricht dabei einen Umfang von zwei Unterrichtsstunden pro Woche für zwei bzw. drei Schuljahre. So wurden im Projekt EVENING (Evaluation Englisch in der Grundschule) in den Jahren 2006 bis 2007 mit Schüler*innen aus zwei Kohorten aus Nordrhein-Westfalen (N = 1748 und N = 1344) standardisierte Sprachstandstests durchgeführt (Hör- und Leseverstehenstests, mit einer Teilstichprobe auch Sprechfertigkeitstests) (vgl. Groot-Wilken & Husfeldt, 2013). Im Bereich Hörverstehen befanden sich dabei 73% der Schüler*innen in den oberen zwei Quartilen der maximal erreichbaren Punktzahl, im Bereich Leseverstehen befanden sich 74,2% in den oberen zwei Quartilen (Paulick & Groot-Wilken, 2009). „Die festgestellten Leistungen […] liegen für den weitaus überwiegenden Anteil der Schülerschaft auf bzw. oberhalb der fachlichen Anforderungsniveaus, das der zum Testzeitpunkt geltende Lehrplan vorgibt“ (Paulick & Groot-Wilken, 2009, 194f.). Ebenfalls zeigte sich, „[…] dass viele Sprecher über […] eine basale produktive Fertigkeit des Sprechens in der Fremdsprache am Ende des 4. Schuljahres verfügen“ (Keßler, 2009, 175). Ähnliche Ergebnisse bzgl. des Hörverstehens wurden auch im Rahmen der KESS-Studie (Kompetenzen und Einstellungen von Schülerinnen und Schülern) im Bundesland Hamburg berichtet (May, 2006). In der BIG-Studie (BIG-Kreis, 2015) wurden verschiedene sprachliche Kompetenzen von N = 2148 Schüler*innen der Klassenstufe 4 aus 15 Bundesländern untersucht. Dabei ergaben sich ähnliche bzw. etwas positivere Ergebnisse im Vergleich zur EVENING-Studie. Insgesamt lässt sich das erreichte Sprachniveau in diesen Studien im Durchschnitt äquivalent zum Niveau A1 des gemeinsamen europäischen Referenzrahmens für Sprachen (CEFR) (Council of Europe, 2001; 2018) einordnen (vgl. Fleckenstein, 2020). Auch in weiteren Untersuchungen (in Deutschland und in anderen Ländern) zum Englischunterricht in Grund- bzw. Elementarschulen konnte beobachtet werden, dass Grundschüler*innen substanziell sprachliche Kompetenzen aufbauen (z.B. Goorhuis-Brouwer & de Bot, 2010; Heinzmann et al., 2009; vgl. Schwandtke, 2023).

Wann ist der ideale Startzeitpunkt?

Auf Basis der empirischen Untersuchungen zeigt sich, dass Grundschüler*innen im Englischunterricht etwas dazu lernen. Der Unterricht ist also in diesem Sinne wirksam. Offen bleibt dabei allerdings die Frage, wann mit dem Unterricht optimal begonnen werden sollte. In Klasse 1 oder eher in Klasse 3? Oder zu einem anderen Zeitpunkt? Personen, die für einen möglichst frühen Beginn von Fremdsprachenunterricht argumentieren, beziehen sich häufig auf die Hypothese, dass für den Erwerb einer Zweitsprache eine so genannte kritische Periode existiere (vgl. DeKeyser & Larson-Hall, 2005; Lenneberg, 1967). Damit ist ein Zeitfenster in der Entwicklung von Kindern gemeint, in dem diese bestimmte Fähigkeiten im Umgang mit einer zweiten Sprache (Grammatik, Phonologie) besonders gut bzw. einfach erlernen könnten, was später nur mit größerem Lernaufwand möglich sei. Hinweise für die Plausibilität dieser These zeigen Forschungen zu bilingual aufwachsenden Kindern oder zu sogenannten Sprachimmersionsprogrammen (z.B. Böttger & Müller, 2023; Gebauer et al., 2013). Es wird jedoch innerhalb der Spracherwerbsforschung diskutiert, ob dieser Ansatz überhaupt auf den Unterricht in der Grundschule mit einer relativ geringen Zahl an Lerngelegenheiten übertragen werden kann (vgl. Sopata, 2018; Larson-Hall, 2008). Abgesehen von dieser Hypothese wird aber grundsätzlich erwartet, dass ein früherer Beginn generell mit mehr Lerngelegenheiten für das Englischlernen einhergeht.

In Zusammenfassungen internationaler empirischer Studien zeigt sich meist, dass ältere Kinder (über 10 Jahre) einen etwas schnelleren Zuwachs in sprachlichen Kompetenzen aufweisen als jüngere Kinder (5 bis 8 Jahre) und sich eine Art Aufholeffekt der später startenden Schüler*innen ergibt (Huang, 2016). Eventuell sind es derartige Untersuchungen, auf die sich Heinz-Peter Meidinger im oben genannten Zitat bezieht. Das ist allerdings nur eine Vermutung meinerseits. Allerdings besteht in Bezug auf derartige Studien immer eine Schwierigkeit darin, dass für einen sinnvollen Vergleich zwischen den beiden Gruppen auch die Anzahl an Lerngelegenheiten vergleichbar sein muss. Studien mit einer besseren Kontrolle der Bedingungen (wie die Anzahl an Lerngelegenheiten) lassen z.B. vermuten, dass ein früherer Start sich auf verschiedene Aspekte sprachlicher Kompetenz unterschiedlich auswirkt (vgl. Muñoz, 2006). Für den Kontext des Englischunterrichts in der Grundschule in Nordrhein-Westfalen berichten Wilden et al. (2013) auf Basis einer Analyse von Sprachtest von ca. N = 6500 Schüler*innen einen kleinen statistisch signifikanten Vorteil für Schüler*innen, deren Englischunterricht schon in der ersten Klasse begonnen hat, im Vergleich zu Schüler*innen, die in der dritten Klasse begonnen haben (Effektstärken: Hörverstehen d = 0.21, Leseverstehen d = 0.17). Aber auch hier waren in beiden Gruppen jeweils unterschiedlich viele Lerngelegenheiten verfügbar. Insgesamt sind die Ergebnisse empirischer Untersuchungen zur Frage nach dem Effekt des frühen Beginns des Englischlernens auf den Kompetenzerwerb in der Grundschule nicht eindeutig.

Was bringt früher Fremdsprachenunterricht langfristig?

Unabhängig davon, ob sie in der ersten oder dritten Klasse begonnen haben, erwerben Schüler*innen im Englischunterricht der Grundschule fremdsprachliche Kompetenzen. Heinz-Peter Meidinger bezieht sich in seiner Kritik allerdings auf die „fremdsprachliche Kompetenz von Schulabsolventen“ (Meidinger, 2021, 57) und damit auf den Zeithorizont der gesamten Schullaufbahn. Zur Frage, wie sich früher Fremdsprachenunterricht in der Grundschule mittelfristig (z.B. in weiterführenden Schulen) oder langfristig (z.B. bei Absolvent*innen) auswirkt, liegen ebenfalls schon einige Untersuchungen vor (vgl. Fleckenstein et al., 2020; vgl. Huang, 2016). Methodisch werden in derartigen Untersuchungen meist bestimmte Aspekte von fremdsprachlichen Kompetenzen in einer größeren Stichprobe von Schüler*innen untersucht (sowohl querschnittlich zu einem Zeitpunkt oder auch die längsschnittliche Entwicklung zu mehreren Zeitpunkten) und anschließend verschiedene Subgruppen von Schüler*innen verglichen, die sich darin unterscheiden, wann diese zum ersten Mal Fremdsprachenunterricht erhalten haben.

Insgesamt sind die Ergebnisse heterogen (Fleckenstein et al., 2020) und es finden sich sowohl Untersuchungen, in denen Lernende mit einem früheren Start in höheren Klassen höhere Kompetenzen aufweisen (z.B. Mihaljevic Djigunovic et al., 2008), als auch Untersuchungen, in denen in höheren Klassen keine Unterschiede zwischen Schüler*innen mit früherem oder späteren Beginn des Fremdsprachenunterrichts gefunden wurden (z.B. Pfenniger & Singleton, 2017). Jaekel et al. (2017) berichteten basierend auf einem Vergleich von N = 5130 Schüler*innen in Nordrhein-Westfalen, dass Schüler*innen mit einem Beginn ab der ersten Klasse in Klasse 5 zwar höhere, in Klasse 7 jedoch schlechtere sprachliche Kompetenzen aufwiesen als Schüler*innen mit einem Beginn ab der dritten Klasse. Die Stichprobe war allerdings besonders selektiert (alle Teilnehmenden stammten aus 31 Gymnasien) und es ist unklar, ob der Umfang an Lerngelegenheiten ausreichend kontrolliert wurde (vgl. Baumert et al., 2020). In einer Replikationsstudie (Jaekel et al., 2022a) wurde zusätzlich eine dritte Kohorte (N = 804 Schüler*innen) betrachtet, die ihre Grundschullaufbahn sechs Jahre später im Vergleich zur ersten Studie begonnen hatten. Dabei ergab sich für Klasse 5 ein analoges Ergebnis, für Klasse 7 ein Aufholeffekt für die später startenden Schüler*innen und in Klasse 9 wieder ein Vorteil für früh startende Schüler*innen (Jaekel et al., 2022b). Insgesamt ist die Zusammenfassung der Ergebnisse einzelner Untersuchungen aber schwierig, da sie sich in Untersuchungsdesign, verwendeten Instrumenten und insbesondere den betrachteten Stichproben stark unterscheiden. Im Kern besteht dabei immer die Frage, ob die verglichenen Schüler*innengruppen über vergleichbare Eingangsvoraussetzungen verfügen (siehe hierzu auch unseren Beitrag zur Todsünde Nr. 2). Für den Englischunterricht in Deutschland überwiegen dabei bisher Untersuchungen, die keinen Vorteil eines früher beginnenden Englischunterrichts zeigen. Ist also ein früher Beginn des Englischunterrichts nicht sinnvoll?

Gelingt der Übergang in die weiterführende Schule?

Für eine Interpretation dieser Ergebnisse sollte die für die meisten Untersuchungen geltende Anmerkung von Fleckenstein et al. (2020) beachtet werden: „Keine der Untersuchungen prüfte aber die Anschlussfähigkeit des Sekundarschulunterrichts an die in der Grundschulzeit erworbenen Kenntnisse – eine Voraussetzung, die erfüllt sein muss, bevor Rückschlüsse auf mangelhafte Qualifikationsleistungen der Grundschule gezogen werden können“ (Fleckenstein et al., 2020, 143). Um diese Schwierigkeit in empirischen Analysen berücksichtigen zu können, nutzten Baumert et al. (2020) die Daten der nationalen Überprüfung des Erreichens von Bildungsstandards (BISTA) des IQB für Schüler*innen der Klasse 9. Genauer betrachteten sie die Kohorte des Schuljahres 2008/2009, in dem noch nicht für alle befragten Schüler*innen früher Englischunterricht in der Grundschule stattgefunden hat. Es handelt sich um eine stratifiziert gezogene, repräsentative Stichprobe. Um eine höhere Vergleichbarkeit herzustellen, wurden Schüler*innen mit bestimmten Merkmalen ausgeschlossen (z.B. zu Hause wird Englisch gesprochen, Teilnahme an bilingualen Schulprogrammen). Die für die Analysen genutzte Stichprobe besteht aus N = 19.653 Schüler*innen aus allen Bundesländern. Dabei wurden die fremdsprachlichen Kompetenzen (Lesen, Hörverstehen) von drei Gruppen verglichen: Frühstarter*innen (Beginn Klasse 1 oder 2), Mittelstarter*innen (Beginn Klasse 3 bis 4) und Spätstarter*innen (Beginn Klasse 5). Zudem wurden umfangreiche Einflussvariablen kontrolliert (z.B. die sprachlichen Kompetenzen im Deutschen). Es ergab sich kein signifikanter Unterschied im Ausmaß der fremdsprachlichen Kompetenz zwischen den drei Gruppen, wobei allerdings ein starker Einfluss der Schulform deutlich wird. So wird bezogen auf den Übergang von Grundschule in die weiterführende Schule berichtet: „The finding that none of the specified interactions between AO [age of onset] and school type were significant […] is a strong indicator that secondary-level English instruction failed to respond adaptively to students’ different proficiency levels at entry to the school. These problems seem to be most pronounced in Gymnasium schools […]“ (Baumert et al., 2020, 1092).

Auf Basis dieser Analysen lässt sich begründet vermuten, woran es liegt, dass im Schulsystem (bisher) kein langfristig positiver Effekt eines früheren Fremdsprachenunterrichts beobachtet wurde. Der Unterricht an weiterführenden Schulen wird eventuell nicht ausreichend an die (für viele erfahrenere Lehrkräfte nun auch neuen) Lernvoraussetzungen von Schüler*innen angepasst. Dies ist konsistent zur Formulierung von Heinz-Peter Meidinger, dass viele Lehrkräfte am Gymnasium „nochmals von vorne an[fangen]“ (Meidinger, 2021, 58) und quasi einen einheitlichen Unterricht für alle Klassen unabhängig von den tatsächlichen Voraussetzungen der Schüler*innen anbieten (vgl. Böttger, 2009). Die Untersuchung von Jaekel et al. (2022c) deutet zudem darauf hin, dass insbesondere Schüler*innen mit schwächeren fremdsprachlichen Kompetenzen den Übergang in die weiterführende Schule eher als „Bruch“ im Englischunterricht empfinden. Welchen Schluss man daraus nun zieht ist eine Frage der (normativen) Perspektive. Man könnte sagen, dass Englischunterricht in der Grundschule grundsätzlich nicht mehr erteilt werden sollte (vgl. Votja, 2023), um unterschiedliche Lernvoraussetzungen beim Eintritt in Klasse 5 zu vermeiden. Oder man könnte sagen, dass der Unterricht in Klasse 5 stärker an die individuellen Voraussetzungen der Schüler*innen angepasst werden sollte.

Fazit

Ob zur Beurteilung der Wirksamkeit des frühen Fremdsprachenunterrichts die gesamte Schullaufbahn von Schüler*innen (die je nach weiterführender Schulform zwischen neun und dreizehn Jahren liegen kann) den geeigneten Zeitmaßstab bildet, ist ebenfalls eher eine normative und keine rein empirische Frage. Die Frage, wann der optimale Beginn für den Unterricht ist, wird für andere Fächer der Grundschule auch selten diskutiert. Ist es besser mit Mathematik schon in Klasse 1 zu beginnen und nicht erst ab Klasse 3? Diese Frage wirkt auf den ersten Blick etwas unsinnig, was auch daran liegt, dass die Existenz eines Faches in der Grundschule nicht allein aufgrund empirischer Erkenntnisse zur Effizienz des Lernens in diesem Fach oder aufgrund von Erfordernissen für Unterricht in den weiterführenden Schule legitimiert wird, sondern aus bildungstheoretischen Gründen. Mathematik wird auch aus dem Grund schon früh unterrichtet, weil mathematische Kenntnisse als wichtiges Element der Lebenswelt und Grundlage zu gleichberechtigter Teilhabe für Kinder an der Gesellschaft betrachtet werden. Man kann argumentieren, dass dies in einer stärker globalisierten Welt auch für das Erlernen basaler sprachlicher Kompetenzen im Englischen gilt (vgl. KMK, 2013). Auch der überwiegende Teil von Eltern sieht in repräsentativen Umfragen aktuell Englisch als sehr wichtiges Schulfach (Körber-Stiftung, 2023).

Generell gilt aber für alle Veränderungen im Schulsystem, dass die reine Einführung an einer spezifischen Stelle meist nicht ausreicht, um langfristige Effekte zu erzielen. Veränderungen in der Grundschule sollten bzw. müssen immer auch in weiterführenden Schulen zu Anpassungen führen und dafür wäre es sinnvoll, wenn es bundesweit einheitliche Bildungsstandards für den frühen fremdsprachlichen Unterricht gäbe. Hier möchte ich Heinz-Peter Meidinger also explizit zustimmen, wobei die länderspezifischen Curricula durchaus auch jetzt schon Orientierungspunkte für Lehrkräfte an weiterführenden Schulen bieten (für Nordrhein-Westfalen siehe z.B. hier). Und natürlich kommt es auch darauf an, dass Unterricht, wenn er denn stattfindet, mit einer ausreichenden Qualität erteilt wird. Daher ist es auch notwendig, dass es ausreichend gut ausgebildete Englischlehrkräfte für die Grundschule gibt. Und an dieser Stelle steht auch empirisch fest, dass der Bedarf noch nicht ausreichend gedeckt wird (z.B. Ziegler et al., 2019; vgl. Bartosch et al., 2020).

Das dritte Beispiel für die so genannte Todsünde Nr. 3, die Einführung von Bachelor- und Masterstudiengängen in Deutschland, ist Gegenstand des dritten Teils dieses Beitrags sein. Er findet sich hier.

Literatur:

  • Bartosch, R., Frisch, S., Kötter, M., & Reckermann, J. (2020). Stellungnahme von Vertreter*innen der Fremdsprachenforschung zur Rückverlegung des Englischunterrichts in Klasse 3 in NRW zum Schuljahr 2021/2022. (Online)
  • Baumert, J., Fleckenstein, J., Leucht, M., Köller, O., & Möller, J. (2020). The long‐term proficiency of early, middle, and late starters learning English as a foreign language at school: A narrative review and empirical study. Language Learning, 70(4), 1091-1135. (Online)
  • BIG-Kreis (Hrsg.) (2015). Der Lernstand im Englischunterricht am Ende von Klasse 4. Ergebnisse der BIG-Studie. Domino-Verlag. (Online)
  • Böttger, H. (2009). Englischunterricht in der 5. Klasse an Realschulen und Gymnasien: eine qualitative Studie zur Behandlung der Ergebnisse des Englischunterrichts in der Grundschule im bayerischen Schulsystem. Lehrstuhl für Schulpädagogik, FAU Nürnberg.
  • Böttger, H., & Müller, T. (2023). Learning in Two Languages: A Long-Term Study at Bavarian Bilingual Elementary Schools. In J.L. Estrada Chichón, & F. Zayas Martínez (Eds.), Handbook of Research on Training Teachers for Bilingual Education in Primary Schools (pp. 208-236). IGI Global. (Online)
  • Council of Europe (2001). Common European framework of reference for languages: Learning, teaching, assessment. Council of Europe. (Online)
  • Council of Europe (2018). Common European framework of reference for languages: Learning, teaching, assessment. Companion volume with new descriptors. Council of Europe. (Online)
  • DeKeyser, R. M., & Larson-Hall, J. (2005). What does the critical period really mean? In J. F. Kroll, & A. M. B. Groot (Eds.), Handbook of bilingualism: Psycholinguistic approaches (pp. 88 – 108). Oxford University Press.
  • Doyé, P., & Lüttge, D. (1977). Untersuchungen zum Englischunterricht in der Grundschule. Bericht über das Braunschweiger Forschungsprojekt ‚Frühbeginn des Englischunterrichts‘. Westermann.
  • Fleckenstein, J., Möller, J., & Baumert, J. (2020). Ist jünger immer besser? Frühes Fremdsprachenlernen in der Grundschule. Zeitschrift für Pädagogische Psychologie, 34(3-4), 133-148. (Online)
  • Gebauer, S. K., Zaunbauer, A. C. M. & Möller, J. (2013). Cross-Language Transfer in English Immersion Programs in Germany: Reading Comprehension and Reading Fluency. Contemporary Educational Psychology, 38, 64-74. (Online)
  • Gompf, G. (1986). The Early Start of English—Recent trends and new directions in the Federal Republic of Germany. International Review of Education, 32, 3-22. (Online)
  • Goorhuis-Brouwer, S., & de Bot, K. (2010). Impact of early English language teaching on L1 and L2 development in children in Dutch schools. International Journal of Bilingualism, 14(3), 289-302. (Online)
  • Groot-Wilken, B., & Husfeldt, V. (2013). Die Testinstrumente und -verfahren des EVENING-Projekts: Eine empirische Betrachtungsweise. In O. Börner, G. Engel, & B. Groot-Wilken (Hrsg.), Hörverstehen, Leseverstehen, Sprechen (S. 121–140). Waxmann. (Online)
  • Heinzmann, S., Müller, M., Oliveira, M., Haenni Hoti, A., & Wicki, W. (2009). Englisch und Französisch auf der Primarstufe: Verlängerung des NFP-56-Projekts: Schlussbericht. Pädagogische Hochschule Zentralschweiz. (Online)
  • Hempel, M., Kötter, M., & Rymarczyk, J. (2017). Fremdsprachenunterricht in der Grundschule in den Bundesländern Deutschlands: Eine Bestandsaufnahme des Status quo und seiner gewünschten Weiterentwicklung. Peter Lang International Academic Publishers. (Online)
  • Hopp, H., Vogelbacher, M., Kieseier, T., & Thoma, D. (2019). Bilingual advantages in early foreign language learning: effects of the minority and the majority language. Learning and Instruction, 61, 99-110. (Online)
  • Huang, B. H. (2016). A synthesis of empirical research on the linguistic outcomes of early foreign language instruction. International Journal of Multilingualism, 13, 257-273. (Online)
  • Jaekel, N., Schurig, M., Florian, M., & Ritter, M. (2017). From early starters to late finishers? A longitudinal study of early foreign language learning in school. Language Learning, 67, 631–664. (Online)
  • Jaekel, N., Schurig, M., & Ritter, M. (2022a). Investigating cohort effects of early foreign language learning. The Language Learning Journal, 1-13. (Online)
  • Jaekel, N., Schurig, M., van Ackern, I., & Ritter, M. (2022b). The impact of early foreign language learning on language proficiency development from middle to high school. System106, 102763. (Online)
  • Jaekel, N., van Ackern, I., Schurig, M., & Markus, R. (2022c). Investigating the transition from elementary to secondary school: student perspectives of the continuum and receptive language proficiency. The Language Learning Journal, 50(6), 747-762. (Online)
  • Jung, B. (2015). Fremdsprachenunterricht am Übergang von der Primar-zur Sekundarstufe: eine Pilotstudie zum saarländischen Französischunterricht. Universität Koblenz-Landau. (Online)
  • Kaifel, F. (1972). Englisch in der Grundschule: ein Vergleich von Schulversuchen in Berlin, Kiel, Bochum, Tübingen und Kassel. Pädagogische Hochschule Weingarten.
  • Keßler, J. (2009). Zum mündlichen englischen Sprachgebrauch von Grundschulkindern in Nordrhein-Westfalen am Ende des 4. Schuljahres. In G. Engel, Groot-Wilken, & E. Thürmann (Hrsg.), Englisch in der Primarstufe – Chancen und Herausforderungen. Evaluation und Erfahrungen aus der Praxis (S. 158-178). Cornelsen.
  • KMK (2013). „Fremdsprachen in der Grundschule – Sachstand und Konzeptionen 2013“ – Beschluss der Kultusministerkonferenz vom 17.10.2013. (Online)
  • Körber-Stiftung (Hrsg.) (2023). Eltern im Fokus 2023. Wie Eltern auf Bildung und die berufliche Zukunft ihrer Kinder blicken. Körber-Stiftung. (Online)
  • Larson-Hall, J. (2008). Weighing the benefits of studying a foreign language at a younger starting age in a minimal input situation. Second Language Research, 24, 35-63. (Online)
  • Lenneberg, E. (1967). Biological foundations of language. Wiley.
  • May, P. (2006), Englisch-Hörverstehen am Ende der Grundschulzeit. In W. Bos, & M. Pietsch (Hrsg.), KESS 4 – Kompetenzen und Einstellungen von Schülerinnen und Schülern am Ende der Jahrgangsstufe 4 in Hamburger Grundschulen (S. 223-224). Waxmann.
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Mihaljevic Djigunovic, J., Nikolov, M., & Otto, I. (2008). A comparative study of Croatian and Hungarian EFL students. Language Teaching Research, 12, 433–452. (Online)
  • MSB NRW (Ministerium für Schule und Bildung des Landes Nordrhein-Westfalen) (1996). Anlage zur Verordnung über den Bildungsgang in der Grundschule (Ausbildungsordnung gemäß § 26 b SchVG – AO-GS). (Online)
  • MSB NRW (Ministerium für Schule und Bildung des Landes Nordrhein-Westfalen) (2003). Verordnung über den Bildungsgang in der Grundschule (Ausbildungsordnung
    gemäß § 26 b SchVG – AO-GS) in der Fassung der Bekanntmachung vom 14. November 1996
    , geändert durch VO v. 31. 1. 2003; in Kraft getreten am 1. August 2003. (Online)
  • MSB NRW (2005). Anlage zur Verordnung über den Bildungsgang in der Grundschule (Ausbildungsordnung Grundschule – AO-GS). (Online)
  • MSB NRW (2009). Anlage zur Verordnung über den Bildungsgang in der Grundschule (Ausbildungsordnung Grundschule – AO-GS). (Online)
  • MSB NRW (2021). Anlage zur Verordnung über den Bildungsgang in der Grundschule (Ausbildungsordnung Grundschule – AO-GS). (Online)
  • Muñoz, C. (2006). The effects of age on foreign language learning: The BAF Project. In C. Muñoz (Ed.), Age and the rate of foreign language learning (pp. 1–40). Multilingual Matters.
  • Paulick, C., & Groot-Wilken, B. (2009). Rezeptive Fähigkeiten und Fertigkeiten am Ende der 4. Klasse unter besonderer Berücksichtigung der sprachlichen Schülerbiografien. In G. Engel, Groot-Wilken, & E. Thürmann (Hrsg.), Englisch in der Primarstufe – Chancen und Herausforderungen. Evaluation und Erfahrungen aus der Praxis (S. 179-196). Cornelsen.
  • Peyer, E., Andexlinger, M., Kofler, K., & Lenz, P. (2016). Projekt Fremdsprachenevaluation BKZ: Schlussbericht zu den Sprachkompetenztests. Pädagogische Hochschule Freiburg, CH. (Online)
  • Pfenninger, S. E., & Singleton, D. (2017). Beyond age effects in instructional L2 learning: Revisiting the age factor. Multilingual Matters. (Online)
  • Schlemminger, G. (2011). Sprachprofilanalyse: methodologische Überlegungen und erste Ergebnisse einer Longitudinalstudie zur Sprachentwicklung einer Schülerin in einer bilingualen Grundschulklasse Französisch. Zeitschrift für interkulturellen Fremdsprachenunterricht, 16(2), 93-115. (Online)
  • Schwandtke, K. (2023). Die Grammatik-und Wortschatzkenntnisse von Englischlernenden am Ende der Jahrgangsstufe 4: Eine sprachdidaktische Auswertung dialogischer Sprachdaten. In H. Böttger, & N. Schlüter (Hrsg.), Fortschritte im frühen Fremdsprachenlernen – Band zur 5. Konferenz (S. 204-216). FLOH Stiftung LERNEN. (Online)
  • Sopata, A. (2018). Der frühe Fremdsprachenunterricht–je früher desto besser?. Glottodidactica. An International Journal of Applied Linguistics36(1), 95-105. (Online)
  • Summer, T., & Böttger, H. (Eds.). (2022). English in Primary Education: Concepts, Research, Practice. University of Bamberg Press. (Online)
  • Votja, S. (2023, 9. Juni). Lehrerpräsident gegen Englischunterricht an allen Grundschulen. Zeit Online, https://www.zeit.de/gesellschaft/schule/2023-06/deutscher-lehrerverband-heinz-peter-meidinger-englischunterricht
  • Wilden, E., Porsch, R., & Ritter, M. (2013). Je früher desto besser?–Frühbeginnender Englischunterricht ab Klasse 1 oder 3 und seine Auswirkungen auf das Hör-und Leseverstehen. Zeitschrift für Fremdsprachenforschung, 24(2), 171-201. (Online)
  • Ziegler, C., Richter, D., & Hartung-Beck, V. (2019). Entwicklung des Anteils fachfremden Unterrichts an Berliner Schulen. Eine Untersuchung zur Identifizierung verschiedener Verlaufsmuster. In D. Fickermann, & H. Weißhaupt (Hrsg.), Bildungsforschung mit Daten der amtlichen Statistik (S. 121-139). Waxmann. (Online)

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 4/12 – Teil 1

Todsünde Nr. 3: Zu viele unausgereifte Reformen im Bildungssystem

In einer Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei betrachten wir, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Grundsätzlich ist daher hilfreich, das entsprechende Buchkapitel gelesen zu haben, was ich an dieser Stelle ausdrücklich empfehlen möchte. Thesen aus dem Buch werden im Konjunktiv als indirekte Rede wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll. Der vorherige, zweiteilige Beitrag zu dieser Reihe findet sich hier. An dieser Stelle kann ich auch schon einmal ankündigen, dass auch dieser Beitrag wieder aus zwei Teilen besteht.

Zum Abschied

Bevor wir in diesem Beitrag aber die dritte der vom Autor so bezeichneten zehn Todsünden der Schulpolitik betrachten, möchte ich die Gelegenheit nutzen, Heinz-Peter Meidinger, nachdem er nicht noch einmal zur Wiederwahl als Präsident des Deutschen Lehrerverbandes angetreten ist, einen etwas ruhigeren Ruhestand bzw. eine hoffentlich entspanntere Zeit zu wünschen. Er bleibt dem Verband als Ehrenpräsident erhalten und ich vermute, dass er sich auch in Zukunft immer mal wieder zu verschiedenen Bildungsthemen öffentlich äußern wird, so wie er das ja auch in seinem Buch schon getan hat. Und auch wir werden diese Blogreihe natürlich fortsetzen.

Nichts funktioniert, nichts wird geprüft

Zusammengefasst äußert Heinz-Peter Meidinger im Kapitel zur dritten Todsünde der Schulpolitik in gewohnt zugespitzter Sprache die Kritik, dass durch Bildungspolitker*innen in Schulen bzw. im Schulsystem in zu kurzer zeitlicher Abfolge zu viele Veränderungen vorgenommen werden, „welche Schulen und Lehrkräften eine kontinuierliche Bildungs- und Erziehungsarbeit unmöglich“ (Meidinger, 2021, 51) mache. Dabei gäbe es kaum erfolgreiche Bildungsreformen, die auch wirklich zu einer Verbesserung geführt hätten. Demgegenüber stünde eine Vielzahl von schlechten Veränderungen und Heinz-Peter Meidinger führt aus: „[…] ja eigentlich ist die bildungsdeutsche Bildungspolitik der Nachkriegsgeschichte nichts anderes als eine Aneinanderreihung mehrheitlich gescheiterter Reformen […]“ (Meidinger, 2021, 52).

Als Gemeinsamkeit gescheiterter Reformen benennt Heinz-Peter Meidinger, dass diese „in aller Regel weitgehend ohne vorherige Erprobung, ohne Modellversuche und Evaluationsphasen sowie ohne Beteiligung von kompetenten Schulpraktikern“ (Meidinger, 2021, 52f.) umgesetzt würden. Unabhängig davon, ob das für spezifische Veränderungen zutrifft oder nicht, würde ich selbstverständlich ebenfalls dafür plädieren, dass Interventionen in der Schule bzw. generell in der Bildung natürlich empirisch auf ihre Wirkung analysiert werden sollten, wie es ja auch in anderen gesellschaftlich relevanten Feldern getan wird (z.B. in der Medizin). Eine solche stärkere Orientierung an wissenschaftlicher Evidenz wird auch erwartungsgemäß mehr oder weniger explizit durch viele Bildungswissenschaftler*innen gefordert, wobei im Detail natürlich diskutiert werden muss, welche Art Evidenz gemeint ist und inwiefern vorliegende Evidenz auch konstruktiv in Bildungspraxis einfließen kann bzw. sollte (vgl. Bauer & Koller, 2023; Besa et al., 2023).

Heinz-Peter Meidinger nennt eine Reihe von Beispielen für aus seiner Sicht gescheiterte Bildungsreformen, die ohne ausreichende ergebnisoffene, wissenschaftliche Evaluationen umgesetzt worden seien, z.B. die Umstellung der neunjährigen Schulzeit am Gymnasium auf acht Jahre (siehe hierzu auch den ersten Beitrag unserer Blogreihe), die Einführung der Mengenlehre in der Grundschule in den 70er-Jahren des letzten Jahrhunderts (vgl. Hamann, 2018) oder die Rechtschreibreform (ich vermute, es ist die von 1996 gemeint, das geht aus dem Text leider nicht eindeutig hervor). Während diese Veränderungen eher kurz angerissen werden, werden drei Beispiele im Kapitel etwas ausführlicher erläutert bzw. argumentiert, warum diese negativ oder schädlich gewesen seien: der methodisch-didaktische Lehransatz „Lesen durch Schreiben“, der Fremdsprachenunterricht in der Grundschule sowie die Einführung von Bachelor- und Masterstudiengängen im Zuge der sogenannten Bolognareform. Diese drei werden im Folgenden daher auch vor dem Hintergrund von Ergebnissen der empirischen Bildungsforschung etwas genauer betrachtet.

„Schreiben nach Gehör“ in der Grundschule

Zum ersten dieser drei Beispiele möchte ich vorweg darauf hinweisen, dass ich selbst kein Sprachdidaktiker oder Elementarpädagoge bin. Es ist natürlich dennoch möglich, einen kurzen Überblick über den empirisch-fachdidaktischen Forschungsstand zu geben, auch wenn ich selbst keine vertieften Kenntnisse über die fachdidaktischen Feinheiten von Lehr-Lern-Konzeptionen in dem Feld habe. Mit dem, was in Medienberichten häufig als „Schreiben nach Gehör“ bezeichnet wird, ist meist das methodisch-didaktische Konzept „Lesen durch Schreiben“ gemeint, das in seiner ursprünglichsten Form von dem Schweizer Lehrer Jürgen Reichen konzipiert wurde (Reichen, 1988). Heinz-Peter Meidinger beschreibt die Methode zusammenfassend so, dass „sich Kinder das Schreiben am besten und am leichtesten selbst beibringen könnten“ oder als Methode „[…] mit der von Schülern zunächst alles so geschrieben wird, wie es klingt […]“) (jew. Meidinger, 2021, 54). Diese Beschreibung gibt das Konzept und die damit verbundenen Ziele natürlich nicht vollständig wieder (wobei man berücksichtigen muss, dass das gesamte Kapitel neun Seiten umfasst, auf denen alle drei Beispiele angesprochen werden).

Beispiel für eine Anlauttabelle,
Bildnachweis: Wolfram Esser, Wikipedia (Link)

Worum handelt es sich also beim Konzept „Lesen durch Schreiben“? Auch, wenn man es hier natürlich auch nicht vollständig wiedergeben kann, lässt es sich grundsätzlich als umfassendes didaktisches Konzept für den sprachlichen Anfangsunterricht in der Grundschule verstehen, in dem verschiedene Kompetenzen erworben werden sollen (z.B. Lesekompetenz, Schreibkompetenz). Kennzeichnend für das Konzept in der ursprünglichen Form ist, dass im sprachlichen Anfangsunterricht Schüler*innen Angebote für eine möglichst selbstgesteuerte und individualisierte Auseinandersetzung mit sprachlichen Lerngegenständen gemacht werden sollten, was aber auch nach Reichen (1988) Phasen gemeinsamen Unterrichts im Klassenverband nicht ausschließt (vgl. Lorenz, 2017). Praktisch soll dies möglichst in Form des Werkstattunterrichts stattfinden, also in einer vorbereiteten Lernumgebung (mit Materialien etc.), die von den Schüler*innen relativ selbstständig genutzt wird. Reichen (1988) konkretisiert diese Prinzipien eines offenen, selbstgesteuerten Lernens für den Anfangsunterricht im Lesen und Schreiben, wobei er annahm, dass Kinder mit adäquaten Hilfsmitteln grundsätzlich selbst Lesen und Schreiben können. Nach dem Prinzip „Lesen durch Schreiben“ soll zuerst das Schreiben gelernt werden, „damit das Lesen sich dann mit der Zeit individuell als dessen Produkt gewissermaßen von selbst einstellt.“ (Lorenz, 2017, 34). Zentrales Hilfsmittel im Unterricht bildet eine Anlauttabelle, bestehend aus Buchstaben bzw. Buchstabenkombinationen und zugehörigen Bildern. Die Bilder sind so gewählt, dass die Bezeichnungen der Bilder mit dem zugehörigen Buchstaben beginnen und der Anlaut der Bezeichnung der Lautung des Buchstaben entspricht. Mit dieser Tabelle werden die Schüler*innen angeleitet, Wörter zu schreiben, indem Sie sie phonetisch schrittweise in einzelne Laute zerlegen (vgl. Funke, 2014). Ein damit verbundenes Ziel ist es auch, dass die Lernenden mit diesem Hilfsmittel selbst bestimmen können, was sie mit welcher Absicht schreiben möchten, und daher schon früh beginnen, selbst motiviert eigene Schriftprodukte zu erstellen.

Kann „Lesen durch Schreiben“ funktionieren?

Das Konzept wird innerhalb der Sprachdidaktik schon seit den 90er-Jahren des letzten Jahrhunderts aus theoretischen Gründen kontrovers diskutiert (vgl. Funke, 2014). Das betrifft zum einen die Merkmale der deutschen Sprache selbst. Sie ist keine reine Lautschrift, sondern bedeutungstragende Phoneme werden in der Schriftsprache auch durch abstraktere Lautschemata repräsentiert (Brendel et al., 2011). Dabei kann ein Phonem (also der Laut) auch durch unterschiedliche Grapheme (also dem zugehörigen Schriftausdruck) repräsentiert werden (vgl. Hess et al., 2020). Diese Unterschiede können nicht umfassend in einer Anlauttabelle dargestellt werden. Schüler*innen müssen sie sich daher über die Zeit (bewusst) aneignen, um orthografisch korrekt zu schreiben. Zum anderen bezieht sich ein Teil der Kritik auch auf die Empfehlungen Reichens (1988) zur Umsetzung seines Konzepts selbst. Beispielsweise war für ihn eine korrekte Rechtschreibung im Anfangsunterricht nicht zentral und er empfahl, geschriebene Wörter nur dann zu korrigieren, wenn sie gar nicht lesbar seien oder grobe Lautfehler enthalten; dies auch, um Motivation und Schreibfreude aufrecht zu erhalten (vgl. Lorenz, 2017). Die Schulung der korrekten Rechtschreibung sollte dementsprechend auch erst in der zweiten Klasse beginnen. Demgegenüber wird angenommen, dass die Kinder durch das Fehlen des frühen Einübens korrekter Schreibformen kein korrektes schriftsprachliches, inneres Lexikon aufbauen könnten, und dies auch nicht angeregt würde, da im Anfangsunterricht kaum mit fremden Texten gearbeitet würde (z.B. Dürscheid, 2011). Insbesondere werden Schwierigkeiten für schwächere Schüler*innen mit geringerer phonologischer Bewusstheit auch mit nicht-deutscher Muttersprache vermutet (z.B. Valtin, 1998). Da die Schreib- und Lesekompetenz unabhängig voneinander aufgebaut werden (vgl. Bredel et al., 2011), wird zudem kritisiert, dass zuerst Schreiben gelernt und explizites Lesen lernen bewusst vermieden wird.

Grundsätzlich lässt sich die Arbeit mit Anlauttabellen auch durchaus in Modellen zur Beschreibung des Schriftspracherwerbs von Kindern einordnen. Beispielsweise erfolgt der Aufbau von schriftsprachlichen Fähigkeiten im Modell von Frith (1986) in mehreren Stufen, der mit unterschiedlichen Strategien verbunden ist (vgl. Schründer-Lenzen, 2013). In der ersten Stufe (logografische Strategie) orientierten sich Kinder zunächst an der Oberflächenstruktur der Schriftsprache, indem sie Zeichenfolgen auswendig lernen (z.B. den eigenen Namen). In der zweiten Stufe (alphabetische Strategie) verbinden Kinder die gesprochene Sprache mit der geschriebenen Sprache, indem sie zunächst gesprochene Laute mit unterschiedlichen Buchstaben verbinden. An dieser Stelle können Anlauttabellen verortet werden. Zugleich müssen die Lernenden in dieser Stufe lernen, dass das geschriebene Wort nicht rein der Lautsprache folgt (phonemisches Schreiben), was nach Kritiker*innen im Konzept „Lesen durch Schreiben“ nicht ausreichend gelänge bzw. angestrebt werde. In der dritten Stufe (orthografische Strategie) erkennen Schüler*innen zunehmend schriftsprachliche Strukturen (z.B. Ableitungen von Wortstämmen).

Zusammengefasst wird das Konzept bzw. die Umsetzung in Reinform innerhalb der Sprachdidaktik aus rein theoretischer Sicht schon seit Beginn kritisch diskutiert. Der Entwickler und die Nutzer*innen des Konzepts sehen dies erwartungsgemäß anders und gehen davon aus, dass negative Effekte nicht eintreten, die genannten Schwierigkeiten ausreichend berücksichtigt würden und mögliche Nachteile durch andere Vorteile (z.B. bezogen auf die Schreibmotivation) kompensiert würden (vgl. Reichen, 2006). Entscheidend ist aber auch bei didaktischen Lehr-Lern-Konzepten, wie sie nun tatsächlich wirken bzw. inwiefern die angestrebten Lernziele auch empirisch erreicht werden.

Wie kann man das nun überprüfen?

Heinz-Peter Meidinger beschreibt die Auswirkungen des Konzepts „Lesen durch Schreiben“ als äußerst negativ und kritisiert: „30 Jahre lang wurde die Wirksamkeit nie in einer umfassenden Studie überprüft […].“ (Meidinger, 2021, 55). Erst Prof. Dr. Una Röhr-Sendlmeier habe 30 Jahre nach praktischer Einführung des Konzepts eine solche Studie durchgeführt. Vermutlich bezieht sich Heinz-Peter Meidinger hier auf die Ergebnisse der Promotion von Dr. Tobias Kuhl (2020), einem (nun ehemaligen) Doktoranden von Frau Röhr-Sendlmeier. Das lässt sich allerdings nur aus der Beschreibung der Studie durch Heinz-Peter Meidinger schließen, da leider im Kapitel keine Quellenangabe gemacht wird.

Zunächst ist anzumerken, dass auch schon zuvor empirische Untersuchungen zur Wirksamkeit des Konzepts durchgeführt und veröffentlicht wurden (Funke, 2014). Um die Ergebnisse solcher Studien besser interpretieren zu können, ist es hilfreich, typische Schwierigkeiten zu berücksichtigen, die bei empirischen Wirksamkeitsuntersuchungen solch umfassender didaktischer Lehr-Lern-Konzepte auftreten können. Das betrifft zum ersten die Frage, woran man Erfolg oder Misserfolg erkennen kann. „Lesen durch Schreiben“ ist mit verschiedenen Zielen verbunden (z.B. Erwerb von Schreib- und Lesefähigkeit, Erhöhung der Schreibmotivation). Es muss also meist die Veränderung verschiedener Merkmale von Schüler*innengruppen geeignet erfasst werden. Zum zweiten bezieht sich das Konzept „Lesen durch Schreiben“ auf einen relativ langen Zeitraum, der zudem im Konzept selbst nicht genau abgegrenzt wird. Für eine Untersuchung muss daher geklärt werden, welche Gruppen von Schüler*innen wie lange eigentlich betrachtet werden sollen. Geht es bspw. nur um das erste Schuljahr oder muss eigentlich die gesamte Grundschulzeit betrachtet werden? Sollen Schüler*innen an der weiterführenden Schule untersucht werden? Je länger eine Untersuchung dauert, desto schwieriger ist sie natürlich praktisch durchführbar. Das ist insbesondere deshalb bedeutsam, da man zur Beurteilung der Wirksamkeit natürlich genügend Schüler*innen braucht, damit bei der erwartbaren Streuung überhaupt Durchschnittsunterschiede zwischen Gruppen festgestellt werden können. Zum dritten geht es auch häufig um die Frage, im Vergleich zu was eine Lehr-Lern-Konzeption wirksam ist. Beispielsweise werden Schüler*innen mit Hilfe des Konzepts „Lesen durch Schreiben“ wahrscheinlich mehr Schreib- und Lesefähigkeiten lernen, als wenn sie gar keinen Unterricht erhielten. Daher geht es auch meist um die Frage, ob der Ansatz wirksamer ist im Vergleich zu anderen möglichen Konzepten. Als Vergleichskonzept zu „Lesen durch Schreiben“ dient häufig Unterricht, in denen so genannte Fibeln eingesetzt werden (z.B. die Piri-Fibeln des Klettverlags, explizit nur als Beispiel erwähnt – nicht als Werbung oder Empfehlung). Dabei handelt es sich um Lehrtexte bzw. Unterrichtsmaterialien, die im Sinne eines Lehrgangs sachlogisch, kleinschrittig strukturiert sind und bei dem sich im zugehörigen Unterricht – zugespitzt formuliert – alle Kinder zu gleichen Zeiten mit den gleichen Materialien beschäftigen. Zum vierten besteht natürlich die Frage, wie genau, umfangreich und auch von den Konzeptentwickler*innen intendiert eine Konzeption auch wirklich im Unterricht durchgeführt wird. Werden z.B. nur einzelne Elemente übernommen oder wird einem Konzept vollständig gefolgt? Werden evtl. sogar verschiedene Konzepte vermischt, was im schulischen Unterricht eher der Regelfall zu sein scheint, insbesondere auch im Anfangsschreibunterricht (vgl. Bremerich-Vos & Wendt, 2019). Davon ist abhängig, ob bestimmte Wirkungen auch wirklich einer Konzeption zugeschrieben werden können oder nicht. Und zum fünften muss bei derartigen Vergleichen sichergestellt werden, dass andere Einflussfaktoren auf das Lernen (z.B. Vorwissen, Erstsprache der Schüler*innen) kontrolliert werden, um abschätzen zu können, welchen Effekt eine Methode bzw. ein Konzept allein hat (diese Schwierigkeiten spielte auch in unserem vorherigen Beitrag zu dieser Reihe eine große Rolle).

Grau ist alle Empirie…

Was liegen denn nun für empirische Ergebnisse zu „Lesen durch Schreiben“ vor? Funke (2014) betrachtet in einer sorgfältigen Metaanalyse die Ergebnisse von 16 Untersuchungen, die in zwischen 1985 und 2010 durchgeführt wurden, sich auf die Klassenstufen 1 bis 4 beziehen, als Vergleichsmaßstab Fibelunterricht nutzen und in denen Ergebnisdaten zu Lese- und/oder Schreibkompetenzen vorliegen. Für die Rechtschreibleistung am Ende von Klasse 1 ergab sich eine kleine Effektstärke von d=0.28 (SD=0.09) zugunsten des „Lesen durch Schreiben“-Konzepts. Grundsätzlich lässt sich aber beobachten, dass die Effekte in den jeweiligen Studien stark schwanken (mal zeigten sich bei „Lesen durch Schreiben“ Vorteile, mal gerade umgekehrt). „Die in den verschiedenen Stichproben gefundenen Effekte weichen so stark voneinander ab, dass man sie nicht als zufällige Varianten einer gemeinsamen Wirkgröße von ein- und derselben Ausprägung auffassen kann.“ (Funke, 2014, 27f.) Für die Klassen 2 bis 4 ergab sich eine homogenere kleine Effektstärke von d=-0.26 (SD=0.05) für die Rechtschreibleistung, also ein Nachteil für „Lesen durch Schreiben“. Generell wurden nur bei wenigen Studien die Voraussetzungen kontrolliert. Werden nur diese Studien einbezogen, ergibt sich kein signifikanter Effekt (d=-0.09. SD=0.15, p=0.57). Bzgl. der Leseleistung am Ende von Klasse 1 ergab sich eine kleine Effektstärke von d=-0.27 (SD=0.14), bezogen auf die Klassen 2-4 d=-0.05 (SD=0.09). Zusammengefasst ergab sich also insgesamt kein konsistentes Bild: Beim Lesen in den Klassen 2-4 keine Unterschiede, beim Schreiben Nachteile mit kleinem Effekt. Die Ergebnisinterpretation ist aber durch verschiedene Faktoren eingeschränkt. Neben der schon erwähnten fehlenden Kontrolle der Eingangsvoraussetzungen wurden unterschiedliche Erhebungsinstrumente genutzt und die Zuordnung der untersuchten Klassen erfolgte über Auskünfte der Lehrkräfte; es ist also nicht ganz klar, wie genau die Methoden auch tatsächlich umgesetzt wurden. „Denkbar ist auch, dass Lesen durch Schreiben-Lehrkräfte ihrem schulischen Umfeld nach keine Zufallsauswahl darstellen.“ (Funke, 2014, 36).

Es liegen seitdem auch aktuellere Analysen vor. Beispielsweise untersuchte Lorenz (2017) auf Basis von repräsentativeren Daten aus der Videostudie im Fach Deutsch des Projekts PERLE, inwiefern Zusammenhänge zwischen dem Einsatz des Konzepts „Lesen durch Schreiben“ und der Rechtschreibleistung von Schüler*innen in Klasse 1 bestehen. Basis sind freie Texte bzw. Briefe , die von N=508 Schüler*innen verfasst und hinsichtlich bestimmter Fehlerarten (z.B. bei der Groß- und Kleinschreibung) analysiert wurden. Die Schüler*innen wurden in vier Gruppen eingeteilt, die sich danach unterscheiden, wie sehr das Konzept „Lesen durch Schreiben“ nach Selbsteinschätzungen der unterrichtenden Lehrkräfte im Unterricht eine Rolle spielte (Stufen: dominant, wichtig, untergeordnet, keine Rolle). In differenzierten Mehrebenenanalysen ergab sich: „Kinder, in deren Deutschunterricht „Lesen durch Schreiben“ eine größere Rolle spielt, schreiben insgesamt einen höheren Anteil ihrer Wörter orthographisch falsch.“ (Lorenz, 2017) Diese Ergebnisse wurden mit einer verbesserten Analyse auch in Hess et al. (2020) berichtet. Auch die Ergebnisse einer Simulationsstudie mit Hilfe neuronaler Netze bestätigen die Nachteile des Konzepts in der Tendenz, wobei allerdings der zurückhaltende Umgang mit Fehlerkorrekturen nach den Empfehlungen von Reichen in den Vordergrund gestellt wurde und nicht die Arbeit mit der Anlauttabelle (Born et al., 2022).

Worauf bezieht sich Heinz-Peter Meidinger?

In der von Heinz-Peter Meidinger erwähnten Untersuchung von Kuhl (2020) wurden mit einem hohen methodisch-organisatorischem Aufwand drei Lehr-Lern-Konzepte für den Sprachanfangsunterricht betrachtet. Neben dem Fibelunterricht und „Lesen durch Schreiben“ auch „Graf Orthos Rechtschreibwerkstatt“, das kurz zusammengefasst einige Ideen von „Lesen durch Schreiben“ übernimmt, umfangreiche Selbstlernmaterialien bereitstellt (insbesondere mit Abschreibübungen), dies mit vielen individualisierten Lernphasen verbindet und in Klasse 1 ebenfalls bewusst wenige Fehlerkorrekturen einsetzt. Neben der Rechtschreibleistung wurden hier auch weitere mögliche Wirkungen der Konzepte (z.B. die Beschäftigung mit Schreiben oder Schrift in der Freizeit) untersucht. Basis bilden Daten von N=3084 Kindern von zwölf Schulen „im Umkreis von 50 km um Bonn“ (Kuhl, 2020, 84), wobei für die Längsschnittstudie zur Rechtschreibleistung Datensätze von N=284 Schüler*innen herangezogen wurden (es wurde auch eine Querschnittsuntersuchung durchgeführt). Insbesondere liegen zu diesen Schüler*innen auch Ergebnisse zu den Eingangsvoraussetzungen in die Grundschule vor (z.B. zur phonologischen Bewusstheit, Familiensprache). Von dieser Gruppe wurde ab Ende des ersten Schuljahres jedes Halbjahr bis zum Ende von Klasse 3 standardisiert die Rechtschreibleistung mit Hilfe der Hamburger Schreib-Probe 1 -10 (May, 2013) erfasst. Die Datenerhebung begann im Jahr 2013 und erstreckte sich dementsprechend über mehrere Schuljahre. Die Zuordnung der Schüler’*innen zu den untersuchten Konzepten erfolgte schulweise auf Basis von Angaben der Lehrkräfte und den in der Schule vorhandenen Materialien. Hierzu führt Kuhl (2020) aus: „Jede Schule hatte sich bereits vor der Akquise zur Studienteilnahme dafür entschieden, den Unterricht nach einem gemeinsamen Leitmedium zu gestalten. Es konnte davon ausgegangen werden, dass der Unterricht in der Realität graduell anders durchgeführt wurde, als er in der Theorie von den Entwicklern der verschiedenen didaktischen Ansätze erdacht worden war. […] Dennoch wurde der Unterricht durch die Entscheidung der Schule für einen spezifischen didaktischen Ansatz als Leitmedium maßgeblich geprägt. Deshalb erschien die Zuordnung des Unterrichts einzelner Schulen zu einer Didaktik als sinnvoll.“ (Kuhl, 2020, 71f.). Es wurde bewusst auf Unterrichtsbeobachtungen verzichtet.

Unterschiede zwischen den drei Gruppen wurden mittels Kovarianzanalysen mit Messwiederholung analysiert, wobei die Eingangsvoraussetzungen als Kovariate berücksichtigt wurden. Dabei ergaben sich große Unterschiede zwischen den drei Konzeptionen (F(2,277)=39.93, p<.001, η²=.247). Die Ergebnisse von Schüler*innen, die nach der Rechtschreibwerkstatt oder „Lesen durch Schreiben“ unterrichtet wurden, unterschieden sich nicht signifikant voneinander. Die Schüler*innen im Fibelunterricht allerdings erzielten mit jeweils großen Effekten bessere Rechtschreibleistungen im Vergleich zu den anderen beiden Konzepten zu allen fünf Messzeitpunkten. Am schwächsten Schnitt insgesamt die Rechtschreibwerkstatt ab. Die Unterschiede zwischen Fibelunterricht und „Lesen durch Schreiben“ verringerten sich im zeitlichen Verlauf etwas. Diese Unterschiede wurden auch in der Querschnittsuntersuchung bestätigt. Bezüglich der anderen untersuchten Variablen zeigten sich im Querschnitt dazu bspw. keine Unterschiede in der Lesemotivation oder der Schreibfreude zwischen den Gruppen. Insgesamt zeigt die Untersuchung also einen Vorteil von Fibelunterricht, für dessen Einsatz sich Kuhl (2020) in der Dissertation auch stark ausspricht, teilweise mit aus meiner Sicht überzogenen negativen Wertungen zu didaktischen Konzepten im Allgemeinen und den Fähigkeiten von Lehrkräften. Insbesondere halte ich es für durchaus sinnvoll, wenn Evaluationen im schulischen Setting auch von Pädagog*innen geplant und durchgeführt werden (vgl. Kuhl, 2020, 143), da auch beim Einsatz von Psycholog*innen und Sozialwissenschaftler*innen ein Priming basierend auf persönlichen Erfahrungen stattfinden kann. Die Forderung nach einer stärkeren Evidenzbasierung von schulischem Handeln und der forschungsbasierten Ausbildung von Lehrkräften teile ich aber ausdrücklich.

Es handelt sich insgesamt um eine aufwändige und sorgfältig durchgeführte Studie mit hoher methodischer Qualität in der Durchführung. Dennoch hat auch diese natürlich einige Limitationen, die die Aussagekraft ihrer Ergebnisse einschränken. Diese liegen insbesondere in der Gelegenheitsstichprobe (was nachvollziehbarerweise mit erhebungsökonomischen Gründen zusammenhängt), der Zuteilung der Schüler*innen zu den einzelnen Konzepten und darin, dass keine genauen Informationen zur Umsetzungstreue der Konzepte vorliegen. Kuhl (2020) argumentiert hierzu: „Es ist anzunehmen, dass sich nicht jeder Lehrer streng an die Vorgaben des Leitmediums gehalten hat und Material, das er als didaktisch sinnvoll erachtet hat, in seine Unterrichtsplanung und -durchführung einfließen ließ. Das Unterrichtsgeschehen unterschied sich demnach graduell zwischen den Klassen – auch innerhalb einer Schule. Dennoch haben sich die Lehrer oder der Rektor für ein Leitmedium entschieden, welches in sämtlichen Klassen einer Schule eingesetzt wurde und den ‚Kurs‘ des Unterrichts maßgeblich bestimmt hat.“ (Kuhl, 2020, 146). Diese Annahme ist nachvollziehbar, aber wird hier natürlich nicht empirisch genauer unterlegt. Es bleibt daher leider unklar, wie Rechtschreibunterricht nach der Anfangsphase in den untersuchten Grundschulen stattgefunden hat. Auch sind die Schüler*innen nicht gleichmäßig über die einzelnen Konzepte verteilt (bspw. im Längsschnitt folgendermaßen: Fibel: N=84 ; Lesen durch Schreiben: N=79, Rechtschreibwerkstatt: N=121), wobei die Unterschiede im Querschnitt noch größer sind. Daneben diskutiert bspw. Brügelmann (2020) auch weitere Aspekte der Studie kritisch, wie z.B. die nicht klare konzeptionelle Unterscheidung der verwendeten Ansätze, eine fehlende Auswertung auf Klassenebene, um den Faktor der Lehrkräfte zu kontrollieren, und, dass die Ergebnisse nicht auf die bundesdeutsche Normierung der Hamburger Schreibprobe bezogen würden: „Nach diesem bundesweit repräsentativen Maßstab entsprechen ‚Lesen durch Schreiben‘-Kinder in Kuhls Studie schon zum Ende des Anfangsunterrichts und über die Grundschulzeit hinweg der bundesdeutschen Norm. Sogar der Anteil besonders leistungsschwacher Schüler*innen ist niedriger als in der Bonner Gesamtstichprobe – besonders auffällig in Klasse 1 und 2. Die ‚Ausreißer‘ bilden die (zusammengefassten) Fibel-Klassen (nach oben) und die Rechtschreibwerkstatt-Klassen (nach unten).“ (Brügelmann, 2020, 3).

Und was heißt das jetzt?

Die vorliegenden Ergebnisse sprechen eher dafür, dass der Ansatz „Lesen durch Schreiben“ keine Vorteile, sondern tendenziell Nachteile gegenüber anderen Schreiblernansätzen im Anfangsunterricht hat. In diesem Sinne würde auch ich eher empfehlen, andere Ansätze im Schreibanfangsunterricht zu wählen, wobei – wie schon erwähnt – ich hierzu kein ausgewiesener Experte bin. Hier stimme ich Heinz-Peter Meidinger explizit zu. Allerdings zeigen die vorliegenden Ergebnisse auch nicht, dass Probleme mit der Rechtschreibleistung am Ende der Grundschule allein auf den Einsatz des Konzepts „Lesen durch Schreiben“ zurückgehen, was er – auch außerhalb seines Buches – anscheinend so interpretiert (z.B. hier). Ob ein Verbot von Methoden, wie im Kapitel zustimmend beschrieben, sinnvoll ist, sei einmal dahingestellt (Was soll denn auch genau verboten werden? Die Nutzung von Anlauttabellen, oder dass Rechtschreibfehler nicht korrigiert werden?). Aus Sicht der empirischen Bildungsforschung sei aber zumindest darauf hingewiesen, dass auch die Wirkungen anderer Lehr-Lern-Konzepte selten empirisch geprüft werden und so gut wie fast alle Konzepte „ohne jegliche empirische Evidenz und Erprobung eingeführt und nie evaluiert […]“ (Meidinger, 2021, 56f.) werden. Insofern könnte man die oben beschriebenen Untersuchungen auch als eine erfolgreiche Evaluation von Fibelunterricht interpretieren. Einführung von Konzepten bedeutet an dieser Stelle, dass entsprechende Materialien zur Nutzung im Unterricht zugelassen werden. Aufgrund der Autonomie von Lehrkräften ist der Einsatz spezifischer Lehr-Lern-Konzepte im Detail derzeit nicht vorschreibbar. Und welche Materialien auch außerhalb geschlossener Lehrwerke oder Konzepte von Lehrkräften tatsächlich eingesetzt werden, ist noch einmal eine ganz andere Frage.

Um diesen schon recht umfangreichen Blogbeitrag nicht zu sehr in die Länge zu ziehen, werden wir die anderen beiden von Heinz-Peter Meidinger genannten Beispiele für seine Todsünde Nr. 3 im zweiten Teil dieses Beitrags betrachten. Er wird an dieser Stelle verlinkt, sobald er online ist.

Literatur:

  • Bauer, J., & Kollar, I. (2023). (Wie) kann die Nutzung bildungswissenschaftlicher Evidenz Lehren und Lernen verbessern? Thesen und Fragen zur Diskussion um evidenzorientiertes Denken und Handeln von Lehrkräften. Unterrichtswissenschaft, 51(1), 123-147. (Online)
  • Besa, K. S., Demski, D., Gesang, J., & Hinzke, J. H. (Hrsg.) (2023). Evidenz-und Forschungsorientierung in Lehrer* innenbildung, Schule, Bildungspolitik und-administration: Neue Befunde zu alten Problemen. Springer Fachmedien Wiesbaden. (Online)
  • Born, J., Nikolov, N. I., Rosenkranz, A., Schabmann, A., & Schmidt, B. M. (2022). A computational investigation of inventive spelling and the “Lesen durch Schreiben” method. Computers and Education: Artificial Intelligence, 3, 100063. (Online)
  • Bredel, U., Fuhrhop, N., & Noack, C. (2011). Wie Kinder lesen und schreiben lernen. Gunter Narr Verlag.
  • Bremerich-Vos, A. & Wendt, H. (2019). Zur Nutzung von Laut- bzw. Anlauttabellen im Deutschunterricht der Grundschule. Zeitschrift für angewandte Linguistik, 70(1), 19–36. (Online)
  • Brügelmann, H. (2020). Einordnung der Ergebnisse der „Bonner Studie “zur Wirkung verschiedener Ansätze des Lese-und Schreibunterrichts auf die Entwicklung der Rechtschreibleistung im Verlauf der Grundschulzeit. (Online)
  • Dürscheid, C. (2011). „Schreib nicht, wie du sprichst.“ Ein Thema für den Deutschunterricht“. In B. Rothstein (Hrsg.), Sprachvergleich in der Schule (S. 89-109). Schneider.
  • Funke, R. (2014). Erstunterricht nach der Methode“ Lesen durch Schreiben“ und Ergebnisse schriftsprachlichen Lernens-Eine metaanalytische Bestandsaufnahme. Didaktik Deutsch: Halbjahresschrift für die Didaktik der deutschen Sprache und Literatur, 19(36), 21-41. (Online)
  • Frith, U. (1986). Psychologische Aspekte des orthografischen Wissens. In G. Augst (Hrsg.), New trends in Graphemics and orthography (S. 218–233). Berlin: de Gruyter.
  • Hamann, T. (2018). Die“ Mengenlehre“ im Anfangsunterricht: historische Darstellung einer gescheiterten Unterrichtsreform in der Bundesrepublik Deutschland (Siegener Beiträge zur Geschichte und Philosophie der Mathematik – Band 9). Universitätsverlag Siegen. (Online)
  • Hess, M., Denn, A. K., Kirschhock, E. M., Lorenz-Krause, A., & Lipowsky, F. (2020). Effekte der Konzeption „Lesen durch Schreiben “auf verschiedene Teilbereiche lauttreuer und orthografischer Verschriftung in der Mitte des ersten Schuljahres. Zeitschrift für Grundschulforschung, 13(2), 317-337. (Online)
  • Kuhl, T. (2020). Rechtschreibung in der Grundschule. Berlin: Springer. (Online)
  • Lorenz, A. (2017). Wer schreibt recht, wer schreibt schlecht?: Eine Untersuchung des Zusammenhangs zwischen der Rechtschreibleistung von Erstklässlern und dem Ansatz „Lesen durch Schreiben “von Jürgen Reichen in der Videostudie Deutsch des Projekts PERLE. kassel university press. (Online)
  • May, P. (2013). Hamburger Schreib-Probe 1-10 (HSP). Manual (Neunormierung 2012). Klett.
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Reichen, J. (2006). Hannah hat Kino im Kopf. Die Reichen-Methode Lesen durch Schreiben und ihre Hintergründe für LehrerInnen, Studierende und Eltern (4. Aufl.). Heinevetter.
  • Reichen, J (1988). Lesen durch Schreiben (3. Aufl.). sabe.
  • Schründer-Lenzen, A. (2013). Schriftspracherwerb. Springer VS. (Online)
  • Valtin, R. (1998). Der ‚neue‘ Methodenstreit oder: (Was) können wir aus der amerikanischen Leseforschung lernen? In H. Balhorn, H. Bartnitzky, & A. Speck-Hamdan (Hrsg.), Schatzkiste Sprache 1. Von den Wegen der Kinder in die Schrift (S. 14-46). Arbeitskreis Grundschule.

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 3/12 – Teil 2

Todsünde Nr. 2: Ideologien und Visionen bestimmen schulische Reformen

In einer Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei betrachten wir, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Dieser ist der zweite Teil eines Beitrags, der sich mit der zweiten vom Autoren so bezeichneten Todünde beschäftigt. Im ersten Teil wurde die Kernthese des zugehörigen Kapitels genauer betrachtet. Da diese insbesondere am Beispiel der Einführung von Gesamtschulen im deutschen Bildungssystem konkretisiert wird, wurden anschließend theoretische und (ein paar wenige) historische Hintergründe zu Fragen der Gestaltung von gegliederten und aus Gesamtschulen bestehenden Schulsystemen dargestellt. Dieser Beitrag konzentriert sich nun auf die Ergebnisse empirischer Untersuchungen zum Schulsystem und insbesondere zur Wirkung von Gesamtschulen. Thesen aus dem Buch werden auch in diesem Teil im Konjunktiv als indirekte Rede wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll.

Grau ist alle Empirie…

Was ergaben nun diese ersten empirischen Studien zur neu eingeführten integrierten Gesamtschule? Wie bei einem solch komplexen Untersuchungsgegenstand zu erwarten, sind die Ergebnisse ebenfalls komplex und unterscheiden sich je nach untersuchtem Zielbereich, Bundesland und weiterer Faktoren (vgl. zusammenfassend Fend, 1982). Bspw. untersuchten Fend et al. (1976) mit Hilfe einer Befragung von 3750 Schüler*innen der 9. und 10. Schulstufe, 404 Lehrkräften und 548 Eltern aus Baden-Württemberg, Hessen, Hamburg und Berlin, ob im integrierten Gesamtschulsystem im Vergleich mehr Schüler*innen höhere Schulabschlüsse anstrebten oder welche Rolle Intelligenz in verschiedenen Schulsystem spielte. Grob zusammengefasst ergab sich, dass im Gesamtschulsystem mehr Schüler*innen als Abschluss ein Abitur erwarteten (40% gegenüber 23%, Fend et al., 1976, 141) und dass der Zusammenhang zwischen Intelligenz und Leistungen bzw. Leistungsstatus im Gesamtschulsystem im Vergleich niedriger ausfällt (r = .24 gegenüber r = .38, Fend et al., 1976).

Auch im Abschlussbericht der wissenschaftlichen Beratergruppe zum Gesamtschulversuch von Nordrhein-Westfalen (Kultusminister NRW, 1979) werden umfangreiche Ergebnisse zu Vergleichen zwischen Schüler*innen der beiden Schulsysteme berichtet. Allgemein zusammengefasst zeigte sich, dass bezogen auf fachliche Lernleistungen leistungsschwächere Schüler*innen (definiert anhand der Übergangsempfehlung auf eine Hauptschule) in der 6. Klasse an integrierten Gesamtschulen höhere Leistungen erzielten, als die entsprechende Gruppe im gegliederten System. Bei leistungsstärkeren Schüler*innen (Übergangsempfehlung für Realschule oder Gymnasium) sind die Ergebnisse umgekehrt. Dieses Muster ergab sich allerdings nicht mehr für Schüler*innen in der 9. Klasse, in der die Schüler*innen im gegliederten System höhere Leistungen erzielten (siehe hierzu Kultusminister NRW, 1979, 57ff.). Es wurde allerdings auch eine große Varianz zwischen Schulen innerhalb beider Systeme in den Ergebnissen und auch in den Lerngelegenheiten innerhalb der Schulen für die erfassten Fachleistungen festgestellt. Die Ergebnisse werden zudem in Beziehungen aus Hessen gesetzt, die teils umgekehrte Befunde zeigten. Im Bereich der Lehrkräfte-Schüler*innen-Verhältnisse berichteten Gesamtschüler*innen ein höheres Maß an zugestandener Mitbestimmung durch Lehrkräfte und höhere Selbstständigkeitserwartungen als im gegliederten System. Bei Verstößen gegen schulrelevante Normen (z.B. Störungen etc.) ergaben sich keine Unterschiede zwischen den Systemen. Bezogen auf schulische Abschlüsse erwarben Schüler*innen an Gesamtschulen zu geringeren Anteilen einen Hauptschulabschluss, dafür aber einen höheren Anteil der Fachoberschulreife (68% gegenüber 50%, Kultusminister NRW, 1979, 43f.). In den Oberstufen der Gesamtschulen erreichte allerdings ein geringerer Anteil an Schüler*innen das Abitur (73% gegenüber 86% an Gymnasien, Kultusminister NRW, 1979, 44f.). Es wird in diesem Zusammenhang aber auch formuliert: „Für die Bewertung der Erfolgsquote in der gymnasialen Oberstufe der Gesamtschule ist zu berücksichtigen, daß [sic!] an Gesamtschulen mehr als ein Drittel der Schüler eines Eingangsjahrgangs in die gymnasiale Oberstufe eintritt, während im traditionellen Schulsystem nur etwas mehr als ein Fünftel aller Schüler eines Eingangsjahrgangs […] in die Oberstufe übergeht.“ (Kultusminister NRW, 1979, 45).

Allein der Blick in diese zwei Publikationen zeigt für die Beurteilung der integrierten Gesamtschule: Es ist kompliziert ;). Es besteht eine große Varianz zwischen Ergebnissen verschiedener Schulen innerhalb beider Systeme, innerhalb einzelner Schulen und in den Systemen einzelner Bundesländer (es gibt also auch Überlappungen zwischen den Schulformen, also dass z.B. an bestimmten Gesamtschulen durchschnittlich höhere Leistungen erzielt wurden, als an bestimmten Realschulen oder Gymnasien). Unterschiede in den Curricula und Lerngelegenheiten erschweren zudem einen guten Vergleich. Im letztgenannten Zitat deutet sich eine Schwierigkeit an, die beim Vergleich verschiedener Schulsysteme immer wieder eine Rolle spielt: Es kommt immer darauf an, mit welchen Voraussetzungen Schüler*innen in verschiedene Schulformen übergehen. Um Gesamtschulen und gegliederte Schulsysteme gut vergleichen zu können, wäre es notwendig, dass sich Schüler*innen in den Voraussetzungen möglichst stark ähneln, weil dann Unterschiede in Lernzuwächsen auch deutlich auf das Schulsystem zurückgeführt werden können (wenn man mal davon absieht, dass es noch andere Einflüsse wie die Ausbildung von Lehrkräften etc. gibt).

Das Problem der Eingangsselektivität

Man spricht hierbei auch von der Eingangsselektivität (vgl. Pfost et al., 2010; Ditton & Krüsken, 2006), was meint, dass Schüler*innen sich schon beim Übergang von der Grundschule auf die weiterführende Schulform stark in für das Lernen relevanten Merkmalen unterscheiden. Es ist ein gut belegter Befund der empirischen Bildungsforschung, dass die schulische Leistung von Schüler*innen stark mit den von ihnen ‚mitgebrachten‘ Voraussetzungen zusammenhängen (vgl. Renkl, 2020; vgl. Maaz et al., 2007). Dies meint nicht nur die kognitiven Fähigkeiten oder das Vorwissen aus der Grundschule, sondern auch Aspekte wie den sozio-ökonomischen Status der Familie (z.B. über wieviel Geld eine Familie für weitere Bildungsausgaben verfügt, Berufstätigkeit der Eltern), das Bildungsniveau der Familie (z.B. Abschlüsse der Eltern, Zugang zu Bildungsmedien), oder der Migrationsstatus der Familie (z.B. Kenntnis der Unterrichtssprache) (vgl. Watermann & Baumert, 2006).

Die Eingangsselektivität ist im deutschen Schulsystem relativ groß und es bestehen große Unterschiede zwischen den Voraussetzungen von Schüler*innen der verschiedenen Schulformen. Man spricht in diesem Zusammenhang auch von der Komposition der Schülerschaft einer Schule oder Schulform (vgl. Baumert et al., 2006). Im IQB-Bildungstrend 2018, der aktuellsten veröffentlichten, auf deutschlandweit repräsentativen Daten für die Sekundarstufe I (bezogen auf die 9. Klasse) beruhenden Untersuchung, wurde bspw. beobachtet, dass sich die Zusammensetzung der Schülerschaft an Gymnasien und nicht-gymnasialen Schulformen stark unterscheidet. So hatte an Gymnasien im Jahr 2018 ein Anteil von MW = 27,7% (SD = 19,7%) der Schüler*innen einen Zuwanderungshintergrund (mindestens ein im Ausland geborener Elternteil), an nicht-gymnasialen Schulformen demgegenüber MW = 34,4% (SD = 25,6%) (Schipolowski et al., 2019, 148). Ebenso hatten an Gymnasien MW = 60,8% (SD = 7,4%) der Schüler*innen einen mittleren sozio-ökonomischen Status (erfasst mit dem HISEI (Highest International Socio-Economic Index of Occupational Status), vgl. Ganzeboom et al., 1992). An nicht-gymnasialen Schulformen betrug dieser Anteil MW = 42,3% (SD = 7,5%).

Seit den ersten Studien zur integrierten Gesamtschule hat sich im deutschen Schulsystem viel verändert. Ihr Anteil ist gestiegen und es wurden eine Reihe größere large-scale-assessments durchgeführt, die es ermöglichen, Unterschiede in Leistungsständen und Lernverläufen zwischen verschiedenen weiterführenden Schulformen zu betrachten. Auf Basis von Daten der BIJU-Studie (Bildungsprozesse und psychosoziale Entwicklung im Jugendalter), in der von N = 2964 Schüler*innen in der 7. und 10. Klasse mit standardisierten Tests Leistungen im Fach Mathematik und Englisch erfasst wurden, konnten bspw. Köller & Baumert (2001) feststellen, dass sich die Leistungen der Schüler*innen je nach Schulform unterschiedlich entwickeln. Am Gymnasium erreichten Lernende in Klasse 10 die höchsten Werte, lagen aber auch in Klasse 7 schon über den anderen Schulformen. Die Leistungen von Schüler*innen an integrierten Gesamtschulen lagen zwischen denen an Haupt- und Realschulen. Zugleich ergaben sich Unterschiede dahingehend, dass sich auch die Zuwächse an den Schulformen unterschieden, bspw. nahmen die Leistungen im Fach Englisch an Gymnasien auch stärker zu, als an den anderen Schulformen (Baumert et al., 2006). Ähnliche Muster konnten auch in den verschiedenen PISA-Studien beobachtet werden. Bspw. erreichten Schüler*innen an Gymnasien in der PISA-Untersuchung 2012 (N = 5001 15-jährige Schüler*innen, davon ca. 24,3% an einer Form der Gesamtschule) durchschnittlich den höchsten Wert in allen Kompetenzbereichen. Die durchschnittlichen Leistungen von Schüler*innen an Gesamtschulen lagen zwischen den Mittelwerten der Haupt- und der Realschule (z.B. Mathematik: Sälzer et al., 2013b, Naturwissenschaften: Schiepe-Tiska et al., 2013). Auch hier lag – wie schon aus älteren Untersuchungen bekannt – eine starke Varianz der Werte zwischen einzelnen Schüler*innen vor, so dass sich größere Überlappungsbereiche auch zwischen den Schulformen ergaben. In den IQB-Ländervergleichen bzw. Bildungstrends sowie in den PISA-Studien 2015 und 2018 wurden nur das Gymnasium und nicht-gymnasiale Schulformen unterschieden (vgl. hierzu auch Hurrelmann, 2013), wobei Schüler*innen an Gymnasien insgesamt häufiger höhere Kompetenzstufen erreichten (vgl. Reiss et al., 2019; vgl. Reiss et al., 2016; Kölm & Mahler, 2019; Pant et al., 2013). Der von Heinz-Peter Meidinger formulierte „beispiellose Absturz“ (Meidinger, 2021, 39) Baden-Württembergs in nationalen Schulleistungsvergleichen ab 2016 zeigt sich im IQB-Bildungstrend bspw. wie folgt. Der Anteil von Schüler*innen, die den Mindeststandard in Mathematik nicht erreicht hat, sank zwischen den Bildungstrends 2012 und 2018 um ca. 1% und der Anteil, der den Regelstandard erreichte oder übertraf stieg um ca. 2,8% (Kölm & Mahler, 2019, 163f.). Wohl sank aber der Anteil von Schüler*innen an Gymnasien, die den Optimalstandard erreichten (um ca. 5,5%, Kölm & Mahler, 2019, 166). Eine genauere Unterscheidung zwischen Schulformen ist auf Basis der veröffentlichten Daten allerdings nicht möglich.

In allen diesen Untersuchungen wird aber auch ein starker Zusammenhang zwischen Schüler*innenleistungen und dem sozio-ökonomischen, familiären Hintergrund festgestellt, wobei ein ’schwächerer‘ Hintergrund mit schwächeren Leistungen einhergeht (z.B. Mahler & Kölm, 2019; Müller & Ehmke, 2013; vgl. Maaz et al., 2007). Dieser starke Zusammenhang zwischen Voraussetzungen und Lernleistungen erschwert und der stark unterschiedliche Anteil von Schüler*innen bzgl. dieser Voraussetzungen auf unterschiedliche Schulformen erschwert den Vergleich der Wirkungen von Gesamtschulen und einem gegliederten Schulsystem. Inwiefern können Unterschiede in Lernleistungen nun hauptsächlich auf die Schulform (und bspw. damit die Zusammensetzung der Schüler*innenschaft nach Fähigkeiten) zurückgeführt werden, wenn andere Einflussfaktoren so ungleich verteilt sind? Baumert et al. (2006) haben bspw. anhand von Querschnitts-Daten der nationalen Erweiterung der ersten PISA-Studie 2000 untersucht, zu welchem Anteil Unterschiede in den Testergebnissen zur Lesekompetenz zwischen Schulen durch Unterschiede auf der individuellen (z.B. kognitive Fähigkeit, sozio-ökonomischer Status) oder auf institutionellen Ebene (z.B. Schulform, mittleres Leistungsniveau einer Klasse) erklärt werden können. Hierfür berechneten sie komplexe Mehrebenen-Regressionsmodelle. Den größten Einfluss auf individueller Ebene hatten dabei die kognitive Grundfähigkeit (positiv), falls in Deutsch nicht Familiensprache war (negativ) und wenn die Eltern über keine Berufsausbildung verfügten (negativ). Auf institutioneller Ebene hatte die mittlere kognitive Grundfähigkeit einer Klasse, aber auch sie Schulform einen signifikanten Einfluss. Unterschiede zwischen Schulen konnten dabei zum größten Teil durch konfundierte Faktoren erklärt werden, also Faktoren, die das Zusammenwirken mehrerer einzelner Variablen betrachtet (z.B. mittleres Fähigkeitsniveau, Schulform, mittleres Bildungsniveau der Eltern). Der ‚reine‘ Anteil der Schulform war eher gering (Baumert et al., 2006, S. 132). Auch hier zeigt sich, dass die Eingangsselektivität von Schulformen einen großen Einfluss darauf hat, wie Ergebnisse von Leistungsvergleichen zwischen Schulen ausfallen.

Ein Blick in noch aktuellere Analysen

Die Frage danach, ob ein gegliedertes Schulsystem gegenüber einem System aus Gesamtschulen bessere Lernleistungen erzeugt, wurde auch in noch aktuelleren Untersuchungen erneut betrachtet. Esser & Seuring (2020) analysierten, ob innerhalb der deutschen Bundesländer Schulsysteme nach ‚Schärfe‘ der Verteilung von Schüler*innen nach Leistungen bzw. Leistungsfähigkeit nach der Grundschule auf weiterführende Schulformen (operationalisiert nach der Verbindlichkeit der Übergangsempfehlung) Unterschiede hinsichtlich der Lernleistungen bestehen. Vermutet wurde auf Grundlage des komplexen MoAbiT (Model of Ability Tracking, Esser, 2016), dass innerhalb der Schulformen im Vergleich insgesamt höhere Leistungen erzielt werden und dass die Unterschiede zwischen Schüler*innen aufgrund der Voraussetzungen (z.B. sozio-ökonomischer Hintergrund) durch die Differenzierung nicht zunehmen. Grundlage bildeten Daten einer (nicht-repräsentativen) Kohorte Schüler*innen (N = 2662, 13 Bundesländer) in der National Educational Panel Study (NEPS, Blossfeld et al., 2011), deren Leistungen im Lesen und in Mathematik erfasst wurden. Grob zusammengefasst berichten die Autoren auf Basis komplexer hierarchischer Regressionsmodelle, dass ihre Annahmen zutreffen, und kognitive homogenere Schulformen einen Vorteil für die Leistungsentwicklung bilden.

Wurde nun gezeigt, dass gegliederte Schulsysteme vorteilhafter sind als Gesamtschulsysteme? Heisig & Matthewes (2022) argumentieren, dass dies nicht geschlossen werden kann, da kein Schulsystem mit Gesamtschulen mit gegliederten Systemen verglichen wurde, sondern verschiedene gegliederte Schulsysteme untereinander. Sie können allerdings auf Basis desselben Datensatzes und denselben Analysemethoden die Ergebnisse von Esser & Seuring (2020) nicht replizieren. Der Grund hierfür ist auch hier (unter anderem) wieder die Eingangsselektivität verschiedener Schulformen, deren Kontrolle in der Erststudie auch Heisig & Matthewes (2022) kritisieren. Als zentrales Maß der Fähigkeit wurden Maße der kognitiven Fähigkeit zu Beginn von Klasse 5 verwendet. Wurde aber zusätzlich kontrolliert, dass sich Grundschüler*innen in Bundesländern mit unterschiedlich ’strikten‘ Verteilungen nach Fähigkeiten auf weiterführende Schulformen schon vor dem Übergang unterscheiden, dann ließen sich die Ergebnisse von Esser & Seuring (2020) nicht mehr replizieren. Grundschüler*innen unterscheiden sich zwischen den Bundesländern stark bzgl. ihrer Kompetenzen im Lesen und in Mathematik, was auch wiederum mit dem sozio-ökonomischen Hintergrund zusammenhängt (Stanat et al., 2022). Lorenz & Lenz (2022) nutzten die repräsentativen Daten der IQB-Bildungstrends 2015 und 2018 (N = 28.625 Schüler*innen (Deutsch) bzw. 20.772 Schüler*innen (Mathematik)) und versuchten die Ergebnisse von Esser & Seuring (2020) ebenfalls zu replizieren. Sie kamen zu folgendem Ergebnis: „Allerdings unterschied sich die kognitive Homogenität nur in der Stichprobe aus dem Jahr 2015 signifikant zwischen den Systemen. Ein (scheinbar systembedingter) Leistungsvorteil in den Bundesländern mit einer strikten Leistungsdifferenzierung konnte wiederum nur für die Stichprobe aus dem Jahr 2018 und den Kompetenzbereich Mathematik festgestellt werden.“ (Lorenz & Lenz, 2022). Effekte ließen sich also nur teilweise zeigen, wobei die Mechanismen des MoAbiT nicht bestätigt werden konnten. Zusätzlich sehen Lorenz & Lenz (2022) die Tendenz, dass leistungsschwächere Schüler*innen in ’strikt‘ differenzierenden Systemen weniger von einer kognitiven Homogenisierung profitieren, und sie weisen auf die Unterschiede zwischen den Voraussetzungen in den Bundesländern hin.

Fazit

Was kann die empirische Bildungsforschung nun zur Gesamtschule sagen? Ist ein Schulsystem aus Gesamtschulen, also einer Schulform nach der Grundschule für alle Schüler*innen, einem gegliederten System überlegen? Oder ist sie in den Worten von Heinz-Peter Meidinger „umfassend und klar gescheitert“ (Meidinger, 2021, 38). Trotz vieler komplexer Analysen und umfangreicher Untersuchungenn lässt sich dies nicht pauschal mit ‚Nein‘ oder ‚Ja‘ beantworten.

Ein Grund hierfür ist eher forschungsmethodischer Natur. Um Unterschiede zwischen Schulsystemen eindeutig auf die Schulformorganisation zurückführen zu können, müssten im idealen Fall zwei Gruppen von Schüler*innen unterschieden werden, die in der Verteilung möglichst aller lernrelevanten Einflussfaktoren (z.B. kognitive Fähigkeiten, sozio-ökonomischer Hintergrund, Familiensprache) hinreichend gleich sind, sich aber nur darin unterscheiden, in was für einem schulischen System sie in ihrer Schullaufbahn unterwegs sind (und auch dann müssten die zur Verfügung stehenden Lerngelegenheiten, Ausbildung der Lehrkräfte u.v.a hinreichend ähnlich sein). Eine solche Studie bzw. eine solche Ausgangslage wird sich aber unter Realbedingungen kaum herstellen lassen. Solange Gesamtschulen neben den traditionellen Schulen des dreigliedrigen Schulsystems bestehen, wird es aufgrund vieler Gründe so gut wie immer dazu kommen, dass sich bzgl. der Voraussetzungen der Schüler*innen unterschiedliche Verteilungen in verschiedenen Schulformen ergeben und daher eine gewisse Eingangsselektivität bestehen bleiben. Das hat auch damit zu tun, dass mit unterschiedlichen Schulabschlüssen auch bei sonst vergleichbaren Lernleistungen der Schüler*innen stark unterschiedliche weitere Lebenschancen einhergehen (z.B. Schuchart, 2007) und dies den Beteiligten auch bewusst ist.

Ein anderer Grund liegt darin, dass die vorliegenden Forschungsergebnisse auch darauf hindeuten, dass es für die Förderung inhaltsbezogener Kompetenzen weniger auf die äußere strukturelle Gestaltung von Schule ankommt, sondern auf die innere Gestaltung, also darauf, was konkret mit den Schüler*innen im Unterricht gemacht wird. Anders gesagt, es hat einen größeren Effekt, wenn die konkreten Lerngelegenheiten einer konkreten Klasse möglichst qualitätsvoll sind (vgl. Gräsel & Göbel, 2022), als wenn das gesamte System einer bestimmten Struktur folgt. Das soll nicht bedeuten, dass das Schulsystem keine Rolle spielt, es existieren nur eine Menge anderer Stellschrauben, an denen ebenfalls gedreht werden könnte, um Lernleistungen zu verbessern, die nicht auf der obersten Strukturebene liegen. Oder wie Hattie (2002) es formuliert: „Good teaching can occur independently of the class configuration or homogeneity of the students within the class.“ (Hattie, 2002, 449)

Einen bestimmten, positiven Effekt hat die Einführung von Gesamtschulen bzw. die damit verbundenen Untersuchungen und Diskussionen allerdings auf jeden Fall ergeben. Durch sie wurden auch affektiv-emotionale Aspekte der Schule (z.B. Leistungsangst, Schulstress) in der empirischen Bildungsforschung stärker untersucht und insbesondere auch in anderen Schulformen in den Fokus genommen (vgl. Mattes, 2017). Die dritte Todsünde der Bildungspolitik wird Gegenstand des nächsten Beitrags in dieser Artikelreihe sein. Er wird an dieser Stelle verlinkt, sobald er online zugänglich ist.

Literatur:

  • Baumert, J., Stanat, P., & Watermann, R. (2006). Schulstruktur und die Entstehung differenzieller Lern- und Entwicklungsmilieus. In J. Baumert, P. Stanat, & R. Watermann, (Hrsg.), Herkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Verteilungsgerechtigkeit (S. 95-188). VS Verlag für Sozialwissenschaften. (Online)
  • Blossfeld, H.P., & H.G. Roßbach (Hrsg.) (2011). Education as a Lifelong Process – The German National Educational Panel Study (NEPS). Springer VS. (Online)
  • Ditton, H., & Krüsken, J. (2006). Der Übergang von der Grundschule in die Sekundarstufe I. Zeitschrift für Erziehungswissenschaft, 9, 348-372. (Online)
  • Esser, H. (2016). Bildungssysteme und ethnische Bildungsungleichheit. In C. Diehl, C. Hunkler, & C. Kristen (Hrsg.), Ethnische Ungleichheiten im Bildungsverlauf. Mechanismen, Befunde, Debatten (S. 331-396). Springer VS. (Online)
  • Esser, H., & Seuring, J. (2020). Kognitive Homogenisierung, schulische Leistungen und soziale Bildungsungleichheit. Zeitschrift für Soziologie, 49(5-6), 277-301. (Online)
  • Fend, H., Knörzer, W., Nagl, W., Specht, W., & Väth-Szusdziara, R. (1976). Gesamtschule und dreigliedriges Schulsystem. Eine Vergleichsstudie über Chancengleichheit und Durchlässigkeit. Klett Verlag.
  • Fend, H. (1982). Gesamtschule im Vergleich. Bilanz der Ergebnisse des Gesamtschulversuchs. Beltz.
  • Ganzeboom, H. B., De Graaf, P. M., & Treiman, D. J. (1992). A standard international socio-economic index of occupational status. Social Science Research, 21(1), 1-56. (Online)
  • Gräsel, C., & Göbel, K. (2022). Unterrichtsqualität. In H. Reinders, D. Bergs-Winkels, A. Prochnow, & I. Post (Hrsg.), Empirische Bildungsforschung (S.663-674). Springer VS. (Online)
  • Hattie, J. A. (2002). Classroom composition and peer effects. International Journal of Educational Research, 37(5), 449-481. (Online)
  • Heisig, J. P., Elbers, B., & Solga, H. (2020). Cross-national differences in social background effects on educational attainment and achievement: absolute vs. relative inequalities and the role of education systems. Compare: A Journal of Comparative and International Education, 50(2), 165-184. (Online)
  • Heisig, J. P., & Matthewes, S. H. (2022). No Evidence that Strict Educational Tracking Improves Student Performance through Classroom Homogeneity: A Critical Reanalysis of Esser and Seuring (2020). Zeitschrift für Soziologie, 51(1), 99-111. (Online)
  • Köller, O., & Baumert, J. (2001). Leistungsgruppierungen in der Sekundarstufe I. Ihre Konsequenzen für die Mathematikleistung und das mathematische Selbstkonzept der Begabung. Zeitschrift für Pädagogische Psychologie, 15(2), 99-110. (Online)
  • Kölm, J., & Mahler, N. (2019). Kompetenzstufenbesetzungen im Ländervergleich. In P. Stanat, S. Schipolowski, N. Mahler, S. Weirich, & S. Henschel. (Hrsg.), (2019). IQB-Bildungstrend 2018. Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I im zweiten Ländervergleich (S. 157-200). Waxmann. (Online)
  • Kultusminister des Landes NRW (Hrsg.) (1979). Gesamtschule in Nordrhein-Westfalen – Ergebnisberichte. Grevenverlag.
  • Lorenz, G., & Lenz, S. (2022). Vorteile Kognitiver Homogenisierung? Replikation einer Studie von Hartmut Esser und Julian Seuring zu den Auswirkungen von atrikter Leistungsdifferenzierung auf Schulleistungen und Bildungsungleichheit. Preprint. (Online)
  • Maaz, K., Watermann, R., & Baumert, J. (2007). Familiärer Hintergrund, Kompetenzentwicklung und Selektionsentscheidungen in gegliederten Schulsystemen im internationalen Vergleich. Eine vertiefende Analyse von PISA Daten. Zeitschrift für Pädagogik, 53(4), 444-461. (Online)
  • Mahler, N., & Kölm, J. (2019). Soziale Disparitäten. In P. Stanat, S. Schipolowski, N. Mahler, S. Weirich, & S. Henschel. (Hrsg.), (2019). IQB-Bildungstrend 2018. Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I im zweiten Ländervergleich (S. 265-294). Waxmann. (Online)
  • Mattes, M. (2017). Von der Leistungs- zur Wohlfühlschule? Die Gesamtschule als Gegenstand gesellschaftlicher Debatten und pädagogischer Wissensproduktion in der Bundesrepublik Deutschland in den 1970er und 1980er Jahren. In S., Rehm E. Glaser, B. Behm, & T. Drope (Hrsg.), Wissen machen. Beiträge zu einer Geschichte erziehungswissenschaftlichen Wissens in Deutschland zwischen 1945 und 1990. Zeitschrift für Pädagogik – 63. Beiheft (S. 187-206). Beltz Juventa. (Online)
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Müller, K., & Ehmke, T. (2013). Soziale Herkunft als Bedingung der Kompetenzentwicklung. In M. Prenzel, C. Sälzer, E. Klieme, & O. Köller (Hrsg.), PISA 2012 – Fortschritte und Herausforderungen in Deutschland (S. 245-274). Waxmann. (Online)
  • Pand, H-A., Stanat, P., Pöhlmann, C., Hecht, M., […], & Ziemke, A. (2013). Der Blick in die Länder. In H-A. Pand, P. Stanat, U. Schroeders, A. Roppelt, T. Siegle, & C. Pöhlmann (Hrsg.), IQB-Ländervergleich 2012 – Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I (S. 159-247). Waxmann.
  • Pfost, M., Karing, C., Lorenz, C., & Artelt, C. (2010). Schereneffekte im ein-und mehrgliedrigen Schulsystem. Zeitschrift für Pädagogische Psychologie, 24, 258-272. (Online)
  • Reiss, K., Sälzer, C., Schiepe-Tiska, Klieme, E., & Köller, O. (Hrsg.) (2016). PISA 2015 – Eine Studie zwischen Kontinuität und Innovation. Waxmann. (Online)
  • Reiss, K., Weis, M., Klieme, E., & Köller, O. (Hrsg.) (2019). PISA 2018 – Grundbildung im internationalen Vergleich. Waxmann. (Online)
  • Renkl, A. (2020). Wissenserwerb. In E. Wild, & J. Möller (Hrsg.), Pädagogische Psychologie (S. 3-24). Springer. (Online)
  • Roller, M., & Steinberg, D. (2020). The distributional effects of early school stratification-non-parametric evidence from Germany. European Economic Review, 125, 103422. (Online)
  • Sälzer, C., Reiss, K., Schiepe-Tiska, Prezel, M., & Heinze, A. (2013b). Zwischen Grundlagenwissen und Anwendungsbezug: Mathematische Kompetenz im internationalen Vergleich. In M. Prenzel, C. Sälzer, E. Klieme, & O. Köller (Hrsg.), PISA 2012 – Fortschritte und Herausforderungen in Deutschland (S. 47-98). Waxmann. (Online)
  • Schiepe-Tiska, A., Schöps, K., Rönnebeck, S., Köller, O., & Prenzel, M. (2013). Naturwissenschaftliche Kompetenz in PISA 2012: Ergebnisse und Herausforderungen. In M. Prenzel, C. Sälzer, E. Klieme, & O. Köller (Hrsg.), PISA 2012 – Fortschritte und Herausforderungen in Deutschland (S. 189-216). Waxmann. (Online)
  • Schipolowski, S., Stanat, P., Mahler, N., & Lenz, S. (2019). Kontextinformationen zu den Schulsystemen der Länder in der Sekundarstufe I. In P. Stanat, S. Schipolowski, N. Mahler, S. Weirich, & S. Henschel. (Hrsg.), (2019). IQB-Bildungstrend 2018. Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I im zweiten Ländervergleich (S. 131-156). Waxmann. (Online)
  • Schuchart, C. (2007). Schulabschluss und Ausbildungsberuf: Zur Bedeutung der schulartbezogenen Bildungsbiografie. Zeitschrift für Erziehungswissenschaft, 10, 381-398. (Online)
  • Stanat, P., Schipolowski, S., Schneider, R., Sachse, K-A., Weirich, S., & Henschel, S. (Hrsg.) IQB-Bildungstrend 2021. Kompetenzen in den Fächern Deutsch und Mathematik am Ende der 4. Jahrgangsstufe im dritten Ländervergeleich. Waxmann. (Online)
  • Tillmann, K.-J. (2012). Das Sekundarschulsystem auf dem Weg in die Zweigliedrigkeit. Pädagogik, 64(5), 8-12. (Online)
  • Watermann, R., & Baumert, J. (2006). Entwicklung eines Strukturmodells zum Zusammenhang zwischen sozialer Herkunft und fachlichen und überfachlichen Kompetenzen: Befunde national und international vergleichender Analysen. In J. Baumert, P. Stanat, & R. Watermann, (Hrsg.), Herkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Verteilungsgerechtigkeit (S. 61-94). VS Verlag für Sozialwissenschaften. (Online)

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 3/12 – Teil 1

Todsünde Nr. 2: Ideologien und Visionen bestimmen schulische Reformen

In einer Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei betrachten wir, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Nachdem wir im vorherigen Beitrag die erste der vom Autoren so bezeichneten „zehn Todsünden der Schulpolitik“ betrachtet haben, folgt in diesen Beitrag die zweite. Für die weiteren Ausführungen ist eine Kenntnis des entsprechen Buchkapitels hilfreich, weshalb es empfehlenswert ist, es zuvor zu lesen. Thesen aus dem Buch werden im Konjunktiv als indirekte Rede wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll. Es ist ein relativ langer Text geworden, was im Wesentlichen an der Komplexität des im Kapitel behandelten Themas liegt. Daher wurde er für das Blog in zwei Beiträge aufgeteilt.

Ideolog*innen bestimmen bildungspolitische Entscheidungen?

Todsünde Nr. 2 bzw. die Kernthese dieses Kapitels lässt sich dahingehend zusammenfassen, dass viele bildungspolitische Entscheidungen nicht zur Lösung konkreter Sachfragen oder Probleme, sondern aufgrund von, aus Sicht des Autoren, fragwürdiger ideologischer Zielvorstellungen getroffen würden. Er kritisiert, dass aus dieser Perspektive „Schulpolitik der Realisierung einer Utopie zu dienen hat, in erster Linie also Mittel zum Zweck ist, […] um eine vermeintlich bessere Gesellschaft durchzusetzen“ (Meidinger, 2021, 34). Aus diesem ideologisch geprägten Umgang mit bildungspolitischen Fragen, folgen aus Sicht des Autors vier negative Konsequenzen.

  1. Bei Bildungsfragen ginge es nicht um korrekte oder falsche Sachentscheidungen, sondern darum, „[…] ob man auf der Seite des Guten […] steht oder nicht.“ (Meidinger, 2021, 35)
  2. Diskussionen über Schulthemen verliefen zunehmend emotionalisiert und in Freund-Feind-Schemata.
  3. Es bestünde zwischen verschiedenen Beteiligten keine für die Arbeit in und an Schule wichtige Kompromissfähigkeit mehr.
  4. Alle Beteiligten interpretierten die Ergebnisse von Bildungsstudien so, dass es die eigene Sicht auf bildungspolitische Entscheidungen stützte.

„Eine Schule für alle“ als Beispiel ideologischer Bildungsreformen

Heinz-Peter Meidinger erläutert seine Kernthese aus diesem Abschnitt an der Frage nach der strukturellen Organisation von Schule, noch konkreter an „[…] einem heftigen bis heute andauernden Kampf um Schulstrukturen, insbesondere die Ersetzung des gegliederten Schulwesens durch Gesamtschulen“ (Meidinger, 2021, 34). Er bezieht sich auf die Diskussionen zur Einführung von Gesamtschulen in den 1970er Jahren und beschreibt anschließend die Einführung von Gemeinschaftsschulen (grob: Zusammenführung von Haupt- und Realschulen) in Baden-Württemberg im Jahr 2011 als ideologisch motiviert. Diese Einführung (in Verbindung mit z.B. dem Wegfall verbindlicher Übergangsempfehlungen) habe zu einer Verschlechterung von Lernerfolgen in nationalen Schulleistungsvergleichen ab dem Jahr 2016 geführt. Als positiv wird beurteilt, dass die im selben Zeitraum in Hamburg diskutierte Verlängerung der Grundschulzeit um zwei Jahre, eingeordnet als ebenfalls ideologisch motivierte Einführung einer Art Einheitsschule, nicht umgesetzt wurde. Danach habe man in Hamburg die „wirklichen Problemfelder“ (Meidinger, 2021, 42) angegangen (z.B. mangelnde Lernerfolge). Als ähnlich ideologisch motivierte Überlegungen wird in diesem Kapitel ebenfalls die Inklusion von Schüler*innen mit Förderbedarfen in Regelschulen (verbunden mit Schließungen von Förderschulen) beschrieben. Demgegenüber wird an mehreren Stellen des Kapitels mehr oder weniger explizit gefordert, sich bei Änderungen an der Schulstruktur stärker an empirischer Evidenz zu orientieren (z.B. Meidinger, 2021, 34 oder 49).

Zusammengefasst lässt sich festhalten, dass Heinz-Peter Meidinger sich für ein Beibehalten einer mehrgliedrigen Schulstruktur ausspricht bzw. diese nicht durch ein System aus Gesamtschulen zu ersetzen. Zentrale Prämisse hierfür ist die im folgenden Zitat ausgedrückte Bewertung der Gesamtschule:

„Gemessen am eigenen Anspruch ist in Deutschland kaum ein Schulmodell so umfassend und klar gescheitert wie die Gesamt- oder Gemeinschaftsschule. Sie hat weder zu besseren Leistungen, noch zu mehr Bildungsgerechtigkeit, noch zu den erhofften höheren sozialen Kompetenzen geführt.“

(Meidinger, 2021, 38)

Umgekehrt folgt aus diesem Urteil, dass das bestehende Schulsystem mit mehreren Schularten bessere Wirkungen als ein System bestehend aus Gesamtschulen hat bzw. zumindest keine schlechteren. Wobei dies eine Interpretation meinerseits ist und von Heinz-Peter Meidinger im Kapitel nicht so explizit formuliert wird.

Aufbau von Schulsystemen

Die Auswirkung verschieden strukturierter Schulsysteme zu untersuchen, erfordert Forschungsprojekte, die – bezogen auf das Forschungsdesign, die notwendigen Datenerhebungen und die Auswertemethoden – sehr komplex und aufwendig sind. In diesem Blogbeitrag kann daher kein umfassender Einblick gegeben werden, aber ich werde versuchen, einen hinreichenden Überblick zu geben, sodass die oben formulierte Prämisse im Licht der empirischen Bildungsforschung zumindest grob eingeschätzt werden kann. Die Inklusion von Schüler*innen mit Förderbedarfen in Regelschulen wird dabei ausgeklammert (auch weil hierzu die vorliegende Datenlage im Vergleich weniger umfangreich ist).

Es geht im Kern um die Frage, wie ein Schulsystem gestaltet werden sollte, damit die mit der Schule verbundenen Ziele (insbesondere der Aufbau fachlicher oder sozialer Kompetenzen von Schüler*innen) möglichst optimal erreicht werden. In der englischsprachigen Literatur wird in diesem Zusammenhang von explicit tracking oder between-school tracking (vgl. Chmielewski, 2014) gesprochen, also der Aufteilung von Schüler*innen auf verschiedene Schulformen nach bestimmten Kriterien (z.B. nach Fähigkeiten, ability tracking). Implicit tracking oder within-school tracking bezeichnet hingegen die Aufteilung auf z.B. Kurse unterschiedlicher Fähigkeitsniveaus innerhalb einer Schulform, in Deutschland bspw. die Unterscheidung zwischen Grund- und Leistungskursen in der Oberstufe. Die Unterscheidung zwischen Gesamtschulsystemen und differenzierenden Schulsystemen ist allerdings etwas pauschal, da in den meisten Ländern das System in verschiedene Schularten gegliedert ist (Eurydice, 2022; vgl. Klieme et al., 2007). Wesentliche Unterschiede bestehen aber darin, ab welchem Alter sich Schüler*innen auf leistungsdifferenzierende Schulformen aufteilen (vgl. Sälzer et al., 2013a). In Deutschland erfolgt dies im Alter von zehn Jahren und damit im internationalen Vergleich eher früh (vgl. Klieme et al., 2007). Die Grundschule ist in allen Ländern eine Form der Gesamtschule, die von den meisten Schüler*innen besucht wird. Insofern geht es bei der Unterscheidung zwischen Gesamtschul- und gegliederten Systemen primär um weiterführende Schulen.

In Deutschland existieren neben den klassischen Schulformen des dreigliedrigen Schulsystems (Hauptschule, Realschule, Gymmasium) verschiedene Formen der Gesamtschule. Zum einen die integrierte Gesamtschule, die einem integrierten Stufenaufbau folgt, also einer nicht differenzierenden Sekundarstufe I und einer angeschlossenen Oberstufe bzw. Sekundarstufe II innerhalb einer Schule. Diese Form der Gesamtschule ist es, die wie oben erwähnt in den 1970er Jahren diskutiert wurde. Zum anderen existieren auch – in der Sprache des Statistischen Bundesamts (Destatis, 2022) – Schulen mit mehreren Bildungsgängen. Dabei handelt es sich um Schulen der Sekundarstufe I mit innerer Differenzierung, in der Schüler*innen verschiedene Abschlüsse erwerben können. Es sind also Schulen, die grob beschrieben aus einer Zusammenführung von Haupt- und Realschulen gebildet wurden (in Nordrhein-Westfalen bspw. Sekundarschulen genannt) und zusammen mit dem Gymnasium eine Art Schulsystem mit zwei Wegen bilden (vgl. Hurrelmann, 2013). Heinz-Peter Meidinger bezieht sich in seinem Kapitel auf beide Arten, wobei er beide in seine negative Beurteilung der Gesamtschule einschließt. Die von ihm auch beschriebene Verlängerung der Grundschule wird als schulartunabhängige Orientierungsstufe bezeichnet und ist keine Gesamtschule im Sinne der anderen beiden Schularten.

Wie groß ist der Anteil von Gesamtschulen im deutschen Bildungssystem? Im Schuljahr 2021/2022 gab es in Deutschland insgesamt 4058 Gesamtschulen (2156 integrierte Gesamtschulen, 1902 Schularten mit mehreren Bildungsgängen) (Destatis, 2022). Bezogen auf alle allgemeinbildenden, weiterführenden Schulen entspricht das ca. 28% , wobei die meisten von ihnen in Nordrhein-Westfalen und Baden-Württemberg, die wenigsten in Bayern liegen.

Was lässt sich theoretisch erwarten?

Warum sollte man in einem eingliedrigen oder mehrgliedrigen Schulsystem eigentlich höhere Lernzuwächse im Vergleich zum jeweils anderen System erwarten? Fokussiert man sich rein auf die Entwicklung inhaltsbezogener Kompetenzen (z.B. Lesekompetenz, mathematische Kompetenz), dann werden auf theoretischer Basis grundsätzlich die folgenden Begründungsmuster für Vorteile des jeweiligen Systems formuliert.

Befürworter*innen eines Schulsystems, in dem die Schüler*innen nach der Grundschule nach ihrer Leistung bzw. (kognitiven) Leistungsfähigkeit auf verschiedene Schulformen verteilt werden, argumentieren meist dahingehend, dass eine möglichst homogene Zusammensetzung nach Fähigkeiten Vorteile für die Gestaltung des Unterrichts bietet (vgl. Hallinan, 1994). Sind diese auf einem möglichst ähnlichen Niveau, könnten Lehrkräfte ihren Unterricht einfacher und kohärenter an deren Lernvoraussetzungen anpassen und besser an die Voraussetzungen angepasster Unterricht führt zu besseren Lernzuwächsen. In einem so differenzierten System sollte es also dazu kommen, dass Schüler*innen in verschiedenen, nach Leistungsfähigkeit homogenen Schulformen insgesamt besser gefördert würden, was insgesamt zu höheren Zuwächsen führen sollte (z.B. Esser, 2016). Befürworter*innen von einem Gesamtschulsystem argumentieren demgegenüber meist dahingehend, dass sich ein gegliedertes Schulsystem auf Schüler*innen mit geringeren Fähigkeitsvoraussetzungen besonders nachteilig auswirkt, weil bspw. eine Klassenzusammensetzung nur aus Schüler*innen mit schwächeren Voraussetzungen generell effektiven Unterricht erschwert, in solchen Klassen weniger kognitiv anspruchsvoll unterrichtet wird, sodass Zuwächse geringer ausfallen, und es in solchen Klassen an Unterstützung und positiven Leistungsvorbildern von Mitschüler*innen mit besseren Voraussetzungen fehlt (vgl. Heisig & Matthewes, 2022; vgl. Pfeffer, 2015). Außerdem kann das Stigma, auf einer „schlechteren“ Schulform zu sein, das Selbstkonzept (Möller & Köller, 2004) der Schüler*innen negativ formen, was Lernprozesse ebenfalls negativ beeinflusst. Diese Effekte sollten insgesamt sogar dazu führen, dass Unterschiede zwischen den Schüler*innen zunehmen (vgl. Roller & Steinberg, 2020). Dies führe zu einer größeren Bildungsungleichheit zwischen den Schüler*innen.

Je nachdem, welcher theoretischen Argumentation man eher folgt, desto eher befürwortet man die Gestaltung eines Schulsystems mit oder ohne starker externer Differenzierung in Schulformen nach Fähigkeiten. Anzumerken ist allerdings, dass mit Gesamtschulen auch noch weitere Ziele verfolgt werden bzw. bei ihrer Einführung verfolgt wurden, als die Förderung von inhaltsbezogenen Kompetenzen. Diese wurden teilweise auch als bedeutender eingeschätzt, bspw. eine bessere Einbindung von Schüler*innen bei schulischen Belangen (im Sinne von Demokratieförderung, vgl. Klafki, 2021) oder das Ermöglichen höherer Schulabschlüsse für mehr Schüler*innen mit schwächeren sozio-ökonomischen Hintergründen im Sinne von Chancengleichheit (vgl. Wulf, 2014; Hurrelmann, 2013; Fend et al., 1976).

Aller Anfang ist schwierig…

Wie lässt sich nun die Frage klären, welche Gestaltung der Schulstruktur zu positiveren Auswirkungen führt? Dies erfordert einen empirischen Vergleich zwischen Lernverläufen von Schüler*innen in Schulen unterschiedlicher Struktur bzw. aus unterschiedlichen Systemen, und das über längere Zeiträume hinweg; alles unter Berücksichtigung des gesamten jeweiligen nationalen Kontextes. Dies ist zunächst schwierig ist, da sich in Deutschland weiterführende Schulen relativ von Beginn an zu einem dreigliedrigen System entwickelt haben (vgl. Tillmann, 2012). Gesamtschulen wurden daher in den 1970er Jahren zunächst als einzelne Versuchsschulen „geschaffen“, die parallel zum laufenden Betrieb des mehrgliedrigen Systems ihre Arbeit aufnahmen. Nun geschah dies alles schon vor meiner Geburt, sodass ich mich selbst nur auf vorliegende, schriftliche Quellen stützen kann.

Die (mögliche) Einführung dieser ersten integrierten Gesamtschulen war aber auch in den Augen der damals Beteiligten schon stark durch emotionalisierte Freund-Feind-Debatten zwischen Vertreter*innen verschiedener politischer Positionen begleitet (vgl. Mattes, 2017; Hurrelmann, 2013; vgl. Tillmann, 2012). Ebenfalls wurden für die ersten Gesamtschulen schon früh umfangreiche empirische Ergebnisse (gemessen am damaligen Stand der Technik) vorgelegt (z.B. Fend, 1982). Lukesch (1985) konstatierte aber ebenfalls schon damals: „Daß [sic!] darüber hinausgehend die parteipolitische Vermarktung dieser Ergebnisse zu einer einseitigen und bisweilen verzerrenden Karikatur ausartete, war eine weitere leidvolle Erfahrung für die solchermaßen instrumentalisierten Forscher“ (Lukesch, 1985, 525). Die Sicht von Heinz-Peter Meidinger auf diese Zeit entspricht also auch der Sicht der damaligen Protagonist*innen (vgl. Meidinger, 2021, 34ff.).

Welche Ergebnisse diese ersten Untersuchungen erbrachten, ist Gegenstand des zweiten Teils dieses Beitrags. In diesem werden auch die Ergebnisse aktueller Studien zur Frage der Differenzierung im Schulsystem berichtet. Er findet sich hier.

Literatur:

  • Chmielewski, A. K. (2014). An international comparison of achievement inequality in within-and between-school tracking systems. American Journal of Education, 120(3), 293-324. (Online)
  • Destatis (Deutsches Statistik-Informationssystem) (2022). Statistischer Bericht – Allgemeinbildende Schulen – Schuljahr 2021/2022. Statistisches Bundesamt. (Online)
  • Esser, H. (2016). Bildungssysteme und ethnische Bildungsungleichheit. In C. Diehl, C. Hunkler, & C. Kristen (Hrsg.), Ethnische Ungleichheiten im Bildungsverlauf. Mechanismen, Befunde, Debatten (S. 331-396). Springer VS. (Online)
  • European Commission/EACEA/Eurydice (2022). The structure of the European education systems 2022/2023: schematic diagrams. Eurydice Facts and Figures. Publications Office of the European Union. (Online)
  • Fend, H., Knörzer, W., Nagl, W., Specht, W., & Väth-Szusdziara, R. (1976). Gesamtschule und dreigliedriges Schulsystem. Eine Vergleichsstudie über Chancengleichheit und Durchlässigkeit. Klett Verlag.
  • Fend, H. (1982). Gesamtschule im Vergleich. Bilanz der Ergebnisse des Gesamtschulversuchs. Beltz.
  • Hallinan, M.T. (1994). Tracking: From theory to practice. Sociology of Education, 67, 79–84. (Online)
  • Heisig, J. P., & Matthewes, S. H. (2022). No Evidence that Strict Educational Tracking Improves Student Performance through Classroom Homogeneity: A Critical Reanalysis of Esser and Seuring (2020). Zeitschrift für Soziologie, 51(1), 99-111. (Online)
  • Klafki, W. (2021). Integrierte Gesamtschule – Ein notwendiger Schulversuch. In W. Klafki W. (Herausgegeben von K-H. Braun, F. Stübig, & H. Stübig), Schulreformen und Bildungspolitik in der Bundesrepublik Deutschland (S. 127-186). Springer. (Online)
  • Klieme, E., Döbert, H., van Ackeren, I., Bos, W., Klemm, K., […] & Weiß, M. (2007). Vertiefender Vergleich der Schulsysteme ausgewählter PISA-Teilnehmerstaaten: Kanada, England, Finnland, Frankreich, Niederlande, Schweden. Bundesministerium für Bildung und Forschung. (Online)
  • Mattes, M. (2017). Von der Leistungs- zur Wohlfühlschule? Die Gesamtschule als Gegenstand gesellschaftlicher Debatten und pädagogischer Wissensproduktion in der Bundesrepublik Deutschland in den 1970er und 1980er Jahren. In S., Rehm E. Glaser, B. Behm, & T. Drope (Hrsg.), Wissen machen. Beiträge zu einer Geschichte erziehungswissenschaftlichen Wissens in Deutschland zwischen 1945 und 1990. Zeitschrift für Pädagogik – 63. Beiheft (S. 187-206). Beltz Juventa. (Online)
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Möller, J. & Köller, O. (2004). Die Genese akademischer Selbstkonzepte: Effekte dimensionaler und sozialer Vergleiche. Psychologische Rundschau, 55, 19–27. (Online)
  • Pfeffer, F. T. (2015). Equality and quality in education. A comparative study of 19 countries. Social Science Research, 51, 350-368. (Online)
  • Roller, M., & Steinberg, D. (2020). The distributional effects of early school stratification-non-parametric evidence from Germany. European Economic Review, 125, 103422. (Online)
  • Sälzer, C., Prenzel, M., & Klieme, E. (2013a). Schulische Rahmenbedingungen der Kompetenzentwicklung. In M. Prenzel, C. Sälzer, E. Klieme, & O. Köller (Hrsg.), PISA 2012 – Fortschritte und Herausforderungen in Deutschland (S. 155-188). Waxmann. (Online)
  • Tillmann, K.-J. (2012). Das Sekundarschulsystem auf dem Weg in die Zweigliedrigkeit. Pädagogik, 64(5), 8-12. (Online)
  • Wulf, K. (2014). Integrierte Gesamtschule: Geschichte-Konzept-Vergleich. disserta Verlag.

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 2/12

Todsünde Nr. 1: Überforderung von Schule und Lehrkräften

In einer kleinen Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Es geht uns dabei nicht um eine Rezension des Buches, sondern darum, zu schauen, wie Prämissen und Argumentationen vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Nachdem wir im ersten Beitrag Autor und Werk kurz vorgestellt und uns genauer mit der Einleitung beschäftigt haben, wenden wir uns in diesem Beitrag der ersten von zehn Todsünden der Schulpolitik zu; also, Todsünden aus Sicht des Autoren. Um den weiteren Ausführungen folgen zu können, sollte man natürlich das Buch kennen und gelesen haben. Ich möchte daher an dieser Stelle noch einmal ausdrücklich eine Leseempfehlung aussprechen, auch, wenn man die Ansichten des Autors nicht immer teilt. Zu Beginn noch einmal der Hinweis: Im Folgenden formuliere ich viel im Konjunktiv. Das soll keine Zustimmung oder Ablehnung zu Thesen signalisieren, sondern folgt einfach den Regelungen zur indirekten Rede.

Ziele von Schule – Zu viele oder gerade richtig.?

Im Kapitel zur Todsünde Nr. 1 wird – grob zusammengefasst – dahingehend argumentiert, dass die Schule bzw. die tätigen Lehrkräfte zu viele Aufgaben bzw. Ziele verfolgen würden bzw. sollen. Dies wiederum führe zum einen dazu, dass nicht alle Ziele gleichermaßen erreicht werden können und zum anderen dazu, dass Lehrkräfte stark belastet werden, mit Folgen für die Gesundheit. Als Kernaufgaben der Schule werden „Unterricht, Wissens-, Kompetenz- und Wertevermittlung“ (Meidinger, 2021, 26) genannt, denen exemplarisch zehn weitere Zielerwartungen neben- bzw. gegenübergestellt werden. Darunter eher gesamtgesellschaftliche Zielerwartungen (z.B. Inklusion, Integration), aber auch konkretisierte Ziele eher auf Individualebene (z.B. Medienerziehung, Berufs- und Studienorientierung). Die Gegenüberstellung zu den definierten Kernaufgaben wird dabei leider nicht näher erläutert. Bspw. hat Schule natürlich auch eine Erziehungsfunktion und das Ziel „die Demokratie stärken“ (Meidinger, 2021, 26) kann auch als Teil der Wertevermittlung verstanden werden. Viele dieser genannten Ziele sind in allen Kernlehrplänen der Bundesländer verankert (einige auch schon sehr lange), häufig in den allgemeineren Teilen. Insgesamt wird bzgl. schulischer Ziele aber eine Überfrachtung konstatiert, die im weltweiten Vergleich in Deutschland einzigartig hoch sei. Sie werde insbesondere von zwei Akteur*innen an die Schule herangetragen: Bildungspolitiker*innen und Vertreter*innen der wissenschaftlichen Pädagogik. Gerade Letzteren wird polemisch – es ist ja auch eine Streitschrift – ein „Allmachtswahn“ (Meidinger, 2021, 28) als Motiv zugeordnet, der sich darin ausdrücke, neue Lehrkonzepte zu formulieren, die in der Realität nicht umsetzbar seien. Die empirisch ausgerichtete Erziehungswissenschaft hingegen könne die Umsetzbarkeit und Wirkung von Konzepten prüfen. Diese letzte Aussage ist eine Einschätzung, die ich natürlich teile (schon weil ich selbst in diesem Berufsfeld tätig bin ;)).

Grenzen der Individualisierung?

Als Beispiel für eine solche (positive) empirische Betrachtung von Bedingungen des Lernens, wird aus einer Studie – nach Autorenaussage zur Veränderbarkeit von Lernmotivation aufgrund genetischer Prägung – zitiert, in der geschlussfolgert werden würde, dass Schüler*innen aufgrund individueller Begabungen nicht zu gleichen Leistungen befähigt werden können.

„Schüler sind mit individuellen Begabungen ausgestattet, und es wird nicht möglich sein, sie durch Fördermaßnahmen auf breiter Basis zu gleichen Leistungen zu befähigen.“

(Spinath, Spinath & Borkenau, 2008, 114)

Leider ist im Text keine Quellenangabe zum Zitat enthalten. Die Möglichkeiten der Onlinesuche führen zu Spinath et al. (2008), einem Kapitel im als Lehrbuch angelegten Handbuch der Pädagogischen Psychologie. Um diese Aussage etwas genauer einordnen zu können, lohnt ein Blick in das gesamte Kapitel, aus dem das Zitat stammt. Dort werden Forschungen von sozialen und genetischen Determinanten zur Lernfähigkeit von Schüler*innen zusammengefasst. In solchen verhaltensgenetischen Studien wird analysiert, zu welchen Anteilen Unterschiede in der oben beschriebenen Lernfähigkeit von Menschen durch genetische (also feste Anlagen einer Person) oder soziale (also Erfahrungen und Einflüsse des Umfelds) Einflussfaktoren erklärt werden können. Methodisch werden Zwillings- oder Adoptionsstudien durchgeführt, bei der unter verschiedenen Annahmen genetische und soziale Einflüsse kontrolliert werden können. Dabei fassen Spinath et al. (2008) den Einfluss genetischer Determinanten aus Studien auf die allgemeine kognitive Fähigkeit mit ca. 50% zusammen. Die soziale Umwelt hat also einen vergleichbaren Einfluss. Die Bedeutung genetischer Determinanten nimmt über die Lebensspanne allerdings zu. Wichtig ist: mit solchen Anteilen von Varianzkomponenten können Aussagen über Unterschiede zwischen Personen gemacht werden, nicht über Fähigkeiten einer einzelnen Person. Zugleich sind diese Anteile nicht konstant. Spinath et al. (2008) nennen die Körpergröße als Beispiel, die stark genetisch bestimmt ist: „Obwohl die Körpergröße innerhalb einer Kohorte hochgradig genetisch determiniert ist, wurden die Menschen unter sich verbessernden Umweltbedingungen immer größer.“ (Spinath et al.,2008, 113), wobei irgendwann aufgrund der beschränkten Verbesserbarkeit der Umweltbedingungen eine bisher unbekannte Grenze vermutet werden kann. „Analog dazu gilt für die Lernfähigkeit, dass derzeit keine Aussagen darüber möglich sind, wo die Grenzen der Verbesserung durch geeignete Interventionen liegen.“ (Spinath et al.,2008, 113)

Im Kontext des Textes wird dieser Bezug zur Wissenschaft hergestellt, um „die eigenen Möglichkeiten realistisch einzuschätzen“ (Meidinger, 2021, 29), wobei nicht ganz deutlich wird, ob dies eher bezogen auf erzieherische oder lernunterstützende Tätigkeiten gemeint ist. Das obige Zitat wird weitergeführt mit: „Stattdessen gilt es, die vorhandenen Stärken durch individuell angemessene Maßnahmen so zu fördern, dass es allen Schüler möglich wird, ihre Potenziale bestmöglich auszuschöpfen. Ziel von schulischen […] Lernprozessen sollte demnach nicht die Egalisierung des Leistungsniveaus sein, sondern das Hervorbringen von durchaus unterschiedlichen Leistungen auf möglichst hohem Niveau“ (Spinath et al., 2008, 114). Diese individuell angemessenen Verfahren können sich natürlich auf unterschiedliche Kontexte beziehen (z.B. Maßnahmen im Unterricht, Maßnahmen auf Ebene des Schulsystems). Aus Verhaltensgenetischen Studien ergibt sich also nicht direkt eine bevorzugte Handlungsweise, sondern dort sind viele normative Entscheidungen zu treffen.

Welcher Schluss aus diesem Forschungsbeitrag für die Argumentation im Rahmen der Streitschrift gezogen werden soll, bleibt ein wenig unklar. Interpretieren lässt es sich als ein Argument gegen die Forderung eines gemeinsamen Unterrichts von Schüler*innen sehr unterschiedlicher Lernvoraussetzungen, als Gegenposition zum vorher benannten „Allmachtswahn“ von Pädagog*innen. Dies ist allerdings eine Interpretation meinerseits und wird im Text nicht explizit formuliert. Die Quelle bezieht sich jedenfalls weniger auf (eher affektive) Lernmotivation, sondern auf (kognitive) Lernfähigkeit.

Arbeitszeit von Lehrkräften

Als weiteres und das für die im Kapitel thematisierte Todsünde eigentlich bestimmende Beispiel empirischer Bildungsforschung wird im Beitrag auf die Arbeitsbelastung bzw. genauer die Arbeitszeit von Lehrkräften im deutschen Bildungssystem Bezug genommen. Wir fokussieren für diesen Blogbeitrag auch auf die Arbeitszeit, weil im Text zugleich angemerkt wird, dass gerade die Arbeitszeit von Lehrkräften von Seiten der Landesregierungen in Deutschland bisher nicht angemessen untersucht werde, weshalb dies von Lehrerverbänden angestoßen werden müsse. Ein aktuelles Beispiel sei die vom deutschen Philologenverband initiierte LaiW-Studie (Lehrerarbeit im Wandel), die wir später noch genauer betrachten werden.

Die Arbeitszeit von Lehrkräften und auch ihr Belastungserleben wurden schon häufiger empirisch untersucht. Schaarschmidt et al. (2007) berichten bspw. basierend auf Wochenstundenangaben von N = 4181 Lehrkräften verschiedener Schulformen aus Nordrhein-Westfalen eine durchschnittliche Gesamtarbeitszeit von 62,2 Stunden für Vollzeitlehrkräfte und 49,5 Stunden für Teilzeitlehrkräfte. Hardwig & Mußmann (2018) fassen umfangreich Zeiterfassungsstudien zusammen, die zwischen 1958 und 2016 in Deutschland durchgeführt wurden. Zugleich existieren auch aktuellere Ergebnisse aus dem Raum Frankfurt (Mußmann et al., 2020). Grob zusammengefasst, stellten alle diese Untersuchungen fest, dass Lehrkräfte im Mittel mehr Arbeitszeit aufwenden, als es gemäß ihrer Dienstaufgaben bzw. vertraglichen Situation vorgesehen ist, wobei natürlich Abweichungen zwischen einzelnen Untersuchungen und Gruppen von Lehrkräften bestehen.

Die LaiW-Studie ist aber insofern bemerkenswert, als bundesweit vergleichend Daten von insgesamt ca. N = 16.000 erhoben wurden (von Januar 2018 bis Mai 2018) und die Erfassung von Arbeitszeitdaten methodisch relativ präzise erfolgte. Dabei wurden zwei Erfassungsmethoden kombiniert, ein Onlinefragebogen zur Einschätzung der Gesamtarbeitszeit einer Woche (viermal) und ein tägliches Protokoll der Arbeitszeit nach vordefinierten Tätigkeiten über einen Zeitraum von vier Wochen (Kreuzfeld, Felsing & Seibt, 2022). Methodisch interessant ist ebenfalls, dass daneben auch eine app-basierte Erfassung erprobt wurde (Felsing et al., 2019). Für Vollzeitlehrkräfte ergab sich eine durchschnittliche Wochengesamtarbeitszeit von 45.2 Stunden, für Teilzeitlehrkräfte von 36,5 Stunden (für eine bereinigte Stichprobe von N = 6109; Kreuzfeld, Felsing & Seibt, 2022; DPhV, 2020). Die Daten beziehen sich, gemäß dem beauftragenden Verband, allerdings nur auf Gymnasiallehrkräfte.

Wichtig ist zu allen diesen Studien anzumerken, dass innerhalb der Gruppe der Lehrkräfte ebenfalls große Unterschiede existieren (in der LaiW-Studie gaben bspw. 45% der Befragten wöchentliche Arbeitszeiten von über 45 Stunden an, DPhV, 2020). Diese Arbeitszeiten sind im weltweiten Vergleich allerdings nicht unbedingt herausragend hoch. Für die Schweiz ergeben sich bspw. ähnliche durchschnittliche Gesamtwochenarbeitszeiten (Brägger & Schwendimann, 2022), in England etwas höhere (Walker et al., 2019). Hohe Arbeitszeiten gehen mit hohem Belastungserleben einher, welches in vielen der erwähnten Studien ebenfalls erhoben wurde. Es lohnt sich daher, auf diese einen näheren Blick zu werfen. Aus Gründen des Umfangs können wir die Ergebnisse hierzu allerdings nicht umfassend beschreiben, auch weil die Anzahl entsprechender Untersuchungen größer ist als vergleichbare Arbeitszeituntersuchungen (siehe z.B. Rothland, 2007).

Fazit

Was lässt sich hieraus nun bzgl. der Thesen aus dem Buch schließen? Insgesamt ist es empirisch gut belegt, dass Lehrkräfte in Deutschland häufig höhere wöchentliche Gesamtzeiten arbeiten, als vorgesehen, was zu hohen Belastungen führt. Insofern ist diese Prämisse für die formulierte Todsünde Nr. 1 der Überlastung von Lehrkräften auch empirisch gut fundiert und es stimmt, dass diese Untersuchungen fast nur von Lehrerverbänden angestoßen wurden. Die Aussage der zu großen Anzahl unterschiedlicher Zielerwartungen und -vorgaben an Lehrkräfte bzw. an die Schule ist aus der Perspektive der empirischen Bildungsforschung schwierig zu betrachten, da diese These im Text wenig mit Bezug zu empirischen Aussagen formuliert wird (es bleibt eher eine normative Einschätzung). Auch aus dem impliziten Bezug zu verhaltensgenetischen Studien wird keine konkretere Aussage abgeleitet. Die zweite Todsünde wird Gegenstand des nächsten Beitrags in dieser Artikelreihe sein. Er findet sich hier.

Literatur:

  • Brägger, M., & Schwendimann, B. A. (2022). Entwicklung der Arbeitszeitbelastung von Lehrpersonen in der Deutschschweiz in den letzten 10 Jahren. Prävention und Gesundheitsförderung17(1), 13-26. (Online)
  • Deutscher Philologenverband (Hrsg.) (2020). Arbeitsbelastung, Zufriedenheit und Gesundheit von Lehrkräften an Gymnasien. Presse-Konferenz in Berlin, 09.03.2020. (Online)
  • Felsing, C., Kreuzfeld, S., Stoll, R., & Seibt, R. (2019). App-basierte vs. geschätzte Ermittlung der Arbeitszeit von Gymnasiallehrkräften. Prävention und Gesundheitsförderung14(3), 281-289. (Online)
  • Hardwig, T., & Mußmann, F. (2018). Zeiterfassungsstudien zur Arbeitszeit von Lehrkräften in Deutschland. Konzepte, Methoden und Ergebnisse von Studien zu Arbeitszeiten und Arbeitsverteilung im historischen Vergleich. Expertise im Auftrag der Max-Träger-Stiftung. Georg-August-Universität Göttingen. (Online)
  • Kreuzfeld, S., Felsing, C., & Seibt, R. (2022). Teachers’ working time as a risk factor for their mental health-findings from a cross-sectional study at German upper-level secondary schools. BMC public health22(1), 1-12. (Online)
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Mußmann, F., Hardwig, T., Riethmüller, M.m Klötzer, S., & Peters, S. (2020). Arbeitszeit und Arbeitsbelastung von Lehrkräften an Frankfurter Schulen 2020. Georg-August-Universität Göttingen. (Online)
  • Rothland, M. (2007). Belastung und Beanspruchung im Lehrerberuf. Springer VS. (Online)
  • Schaarschmidt, U., Fischer, A., Sieland, B., Rahm, T., & Tarnowski, T. (2007). Die Arbeitszeit der Lehrerinnen und Lehrer in Nordrhein-Westfalen – Ergebnisse und Vorschläge der Projektgruppe QuAGiS zur Entwicklung eines zukunftsfähigen Arbeitszeitmodells. Projektgruppe QuAGiS (Qualität, Arbeit und Gesundheit in Schulen) des VBE NRW. (Online)
  • Spinath, F. M., Spinath, B., & Borkenau, P. (2008). Soziale und genetische Determinanten der Lernfähigkeit. In W. Schneider, & M. Hasselhorn (Hrsg.), Handbuch der Pädagogischen Psychologie (S. 105-115). Hogrefe.
  • Walker, M., Worth, J., & Van den Brande, J. (2019). Teacher workload survey 2019. Research Brief. Department of Education. (Online)

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 1/12

Ist das schon Clickbait?

Zu allen Fragen des deutschen Bildungssystems im Allgemeinen und der Lehrer*innenbildung im Speziellen gibt es eine Vielzahl von Büchern unterschiedlicher Akteur*innen, die einen gewissen Einfluss auf bildungspolitische Diskussionen innerhalb der Medienlandschaft haben bzw. dies wollen. Diese Bücher kritisieren meist bestimmte Defizite und argumentieren davon ausgehend für bestimmte Veränderungen. Wie stichhaltig diese Argumentationen sind, hängt natürlich auch davon ab, wie zutreffend die vorherigen Analysen und Zustandsbeschreibungen sind. Ergebnisse empirischer Bildungsforschung können hierzu Einschätzungen ermöglichen, bspw. ob sie zutreffen oder ob überhaupt Erkenntnisse vorliegen.

Worum gehts?

Bildnachweis: © Stifterverband, CC BY 3.0

In einer kleinen Beitragsreihe möchten wir uns mit einem solchen Buch beschäftigen, das sich neben dem Inhaltlichen auch aufgrund seines Clickbait-ähnlichen Titels perfekt für unseren Blog eignet ;). Es geht um „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) erschienen im Claudius Verlag, München. Heinz-Peter Meidinger ist medial hauptsächlich bekannt als aktueller ehrenamtlicher Präsident des Deutschen Lehrerverbandes. Der Lehrerverband ist eine Dachorganisation von vier bundesweiten Lehrkräfteverbänden, von denen der Deutsche Philologenverband e.V., in dem sich hauptsächlich Gymnasiallehrkräfte organisieren, sicherlich der bekannteste ist. Es ist also nicht möglich als Lehrkraft direkt Mitglied im Lehrerverband zu werden (wobei es auch weitere große Lehrkräfteverbände gibt, die nicht teil des Lehrerverbands sind). Man kann den Lehrerverband auch nach den formulierten Zielen hauptsächlich als eine Vernetzungs- und Abstimmungsorganisation der Mitgliedsverbände bezeichnen, die explizit Einfluss auf politische Entscheidungen zur Entwicklung des Bildungssystems nehmen möchte. Es geht also auch um Lobbyarbeit für bestimmte Ziele. Das Buch kann in diesem Kontext als möglicher Beitrag betrachtet werden, Diskussionen zur Schulpolitik anzuregen, verbunden mit dem Ziel, bestimmte Veränderungen erreichen zu wollen. Anzumerken ist allerdings, dass die im Buch enthaltenen Thesen, Argumente und Begründungen nicht als Positionen des Lehrerverbandes bezeichnet werden.

Der Autor selbst war Gymnasiallehrer und später auch lange Jahre Schulleiter in Bayern und ging im Sommer 2020 in den Ruhestand. Bevor er 2017 erstmalig als Präsident des Lehrerverbandes gewählt wurde, war Heinz-Peter Meidinger 13 Jahre lang Vorsitzender des deutschen Philologenverbandes. Er schreibt also aus der Perspektive des erfahrenen Gymnasialschulleiters mit vielfältigen Einblicken aus der Verbandsarbeit. Mehr erfährt man über ihn und seine Positionen auch auf Wikipedia ;).

Was passiert hier?

In dieser Artikelreihe möchten wir uns etwas differenzierter mit den Argumentationen im Buch aus Perspektive der empirischen Bildungsforschung auseinandersetzen. Dabei geht es uns weniger darum, eine eigene Bewertung der Thesen des Autors vorzunehmen, sondern eher zu prüfen, was man aus Ergebnissen der Bildungsforschung zu ihren Prämissen beisteuern kann oder nicht. Hierzu ist es natürlich sinnvoll, das Buch gelesen zu haben. Das möchte ich an dieser Stelle ausdrücklich empfehlen, auch wenn man vielleicht manche Position des Autors nicht teilt. Man kann durch die Auseinandersetzung auch die eigene Perspektive ausschärfen. Diese Beitragsreihe ist daher keine Rezension im engeren Sinne, sondern wir werden punktuell Aspekte herausgreifen, die sich sinnvoll auf Ergebnisse empirischer Bildungsforschung beziehen lassen. Jede „Todsünde“ bekommt dabei einen eigenen kurzen Beitrag, die in der Länge aber auch sehr variieren können (je nachdem, inwiefern sich inhaltlich anknüpfen lässt).

In diesem Beitrag geht es um das erste Kapitel, quasi das Vorwort, welches mit „Schulpolitik in der Krise“ überschrieben ist. Heinz-Peter Meidinger stellt darin zunächst Bedingungen heraus, die für das Feld der Bildungspolitik charakteristisch seien, z.B. dass das Bildungssystem hochkomplex und durch viele Interdependenzen geprägt sei. Er findet, das deutsche Schulsystem arbeite in vielen Bereichen sehr gut, aber Dinge, die schief laufen, müssten für eine Bestandsaufnahme herausgestellt werden. Die Sprache ist – negativ interpretiert – polemisch, – positiv interpretiert – ausdrucksstark, was sich auch darin zeigt, dass als Analogie für „[…] Konzepte, Reformen, politische Haltungen und Ideologien sowie wiederkehrende Verhaltensmuster, aber auch permanente Untätigkeit sowie bewusste Versäumnisse, die der Bildungsqualität in unserem Land schaden […]“ (Meidinger, 2021, 23) das Konzept der „Todsünde“ aus der katholischen Theologie verwendet wird. Aber es ist ja auch als Streitschrift angekündigt.

G9 zu G8 – Wie ist es gelaufen?

In diesem Vorwortkapitel fällt es schwer, Aussagen zu finden, die mit Bezug zu empirischen Forschungsergebnissen betrachtet werden können. Es enthält viele Meinungsäußerungen, die zumindest an dieser Stelle nicht anhand konkreter Beispiele begründet werden. Eine Ausnahme ist die Thematisierung der Umstellung vieler Bundesländer von einem neunjährigen (G9) hin zu einem achtjährigen Abiturbildungsgang (G8), als Beispiel für eine Veränderung der Schulstrukturen, die möglicherweise zu vielen negativen Nebenwirkungen führte. Heinz-Peter Meidinger nennt Folgende: Baubedarf an Mittagskantinen, mehrfache Überarbeitung der Lehrpläne auf Druck von Außen, weniger Nachwuchs in Sportvereinen, Kirchen bzw. in der Kinder- und Jugendarbeit, weniger junge Menschen nehmen eine duale Ausbildung auf.

Während mir zum Baubedarf keine Studien bekannt sind und Lehrplanüberarbeitungen je nach Bundesland mehr oder weniger häufig vorkamen (und man beides auch als positive Nebenwirkung sehen könnte, weil z.B. Lehrpläne an neue Rahmenbedingungen angepasst wurden), liegen zu den Auswirkungen auf das Freizeitverhalten von Jugendlichen und zur Ausbildungsneigung Analysen auf Basis empirischer Daten vor (vgl. Kühn et al., 2013). Die Ergebnisse zum Freizeitverhalten sind zusammengefasst uneindeutig (vgl. Meyer & Thomsen, 2015), was auch daran liegt, dass die Umstellung von G9 auf G8 nicht in allen Bundesländern gleich verlief, sich die Erfahrungen der Schüler*innen daher unterschieden und die Analysen auch methodisch variieren. Es wurde z.B. häufig mit Selbstauskünften zu vorgegebenen Freizeittätigkeiten gearbeitet, die von Schüler*innen in G9- oder G8-Ausbildungsgängen beantwortet und teils parallel, teils nacheinander erhoben wurden. Daher können die Ergebnisse auch am ehesten differenziert nach Art der Freizeittätigkeit dargestellt werden.

Für Aktivitäten im Sport konnten dabei überwiegend keine bzw. kaum Unterschiede im zeitlichen Umfang für G9- und G8-Schüler*innen festgestellt werden (Laging et al., 2014; im Brahm et al., 2013). Ebenfalls keine Unterschiede zeigen sich bzgl. anderer Tätigkeiten z.B. musischer Hobbys wie Orchester, Unternehmungen mit der Familie, Computer (z.B. Spielen) (Hübner et al., 2017). Stabile signifikante Unterschiede mit eher mittlerem Effekt zeigen sich vor allem für das Ausüben eines Nebenjobs, was häufiger von G9-Schüler*innen getan wurde (z.B. Hübner et al., 2017; Meyer & Thomsen, 2015) und ein Rückgang bzgl. ehrenamtlicher Tätigkeiten (wobei Sport hier noch einmal gesondert erfasst wurde), allerdings ausgehend von einem generell niedrigen Niveau (für Hessen: Meyer & Thomsen, 2015). Eine interessante Erkenntnis im Zusammenhang mit diesen Analysen ist, dass die Schüler*innen innerhalb der G8-Bildungsgänge Freizeit teilweise anders bewerteten bzw. einschätzten, als in G9-Bildungsgängen (Blumentritt et al., 2014). „Folglich scheint die konzeptionelle Engführung von Freizeit als Nicht-Schulzeit aus den exemplarisch ausgewählten Beschreibungen der Schülerinnen und Schüler beider Bildungsgänge nicht vollständig tragfähig.“ (Blumentritt, 2015, 150).

Bezogen auf die These, dass die duale Berufsausbildung unter der Umstellung gelitten habe, liegen kaum empirische Erkenntnisse vor. Marcus & Zambre (2017) berichten, dass nach Einführung der G8-Abiturbildungsgängen weniger junge Menschen ein Studium aufnahmen, was man allerdings nicht direkt so interpretieren kann, dass diese stattdessen eine Berufsausbildung aufnahmen. Es zeigt sich zudem eine Art Pausenjahr vor der Studienaufnahme. Die Entscheidung für ein Studium oder eine Berufsausbildung scheint eher von Faktoren abzuhängen, die unabhängig von der Art des Abiturbildungsgangs sind (vgl. Flake et al., 2017). In seiner Dissertation berichtet Meyer (2016) für Sachsen-Anhalt Analysen, die eher darauf hindeuten, dass G8-Schüler*innen tendenziell sogar vermehrt eine Berufsausbildung an ihr Abitur anschlossen.

Was lässt sich hieraus nun bzgl. der Thesen aus dem Buch schließen? Die Annahme, dass die Umstellung von G9 zu G8 negative Nebenwirkungen hatte, ist vor dem Licht der empirischen Daten teilweise zutreffend, aber nicht bzgl. aller genannten Nebenwirkungen. Die Situation ist in repräsentativeren Stichproben nicht so eindeutig wie suggeriert. Allerdings liegen auch insgesamt wenig empirische Analysen vor. Die erste Todsünde wird Gegenstand des nächsten Beitrags in dieser Artikelreihe sein. Er findet sich hier. Hintergründe zum Autor und zum Buch werden dort nicht noch einmal aufgeführt.

Literatur:

  • Blumentritt, L. (2015). Veränderte Schulzeit–veränderte Freizeit? Freizeit im Kontext der gymnasialen Schulzeitverkürzung. In R. Freericks, & D. Brinkmann (Hrsg.), Die Stadt als Kultur-und Erlebnisraum – Analysen – Perspektiven – Projekte. 3. Bremer Freizeit-Kongress (S. 141-153). Institut für Freizeitwissenschaft und Kulturarbeit e.V. (Online)
  • Blumentritt, L., Kühn, S. M., & van Ackeren, I. (2014). (Keine) Zeit für Freizeit? Freizeit im Kontext gymnasialer Schulzeitverkürzung aus Sicht von Schülerinnen und Schülern. Diskurs Kindheits-und Jugendforschung, 9(3), 15-16. (Online)
  • Flake, R., Malin, L., & Risius, P. (2017). Einflussfaktoren der Bildungsentscheidung von Abiturienten für Ausbildung oder Studium. IW-Trends-Vierteljahresschrift zur empirischen Wirtschaftsforschung, 44(3), 99-115. (Online)
  • Hübner, N., Wagner, W., Kramer, J., Nagengast, B., & Trautwein, U. (2017). Die G8-Reform in Baden-Württemberg: Kompetenzen, Wohlbefinden und Freizeitverhalten vor und nach der Reform. Zeitschrift für Erziehungswissenschaft, 20(4), 748-771. (Online)
  • im Brahm, G., Kühn, S. M., & Wixfort, J. (2013). Wie nehmen Schülerinnen und Schüler des doppelten Abiturjahrgangs die eigene Schulzeit wahr?: Eine geschlechtsspezifische Analyse der Schülerperspektive auf acht-und neunjährige Bildungsgänge am Gymnasium. Schulpädagogik heute, 4(8), 223-240.
  • Kühn, S. M., van Ackeren, I., Bellenberg, G., Reintjes, C., & im Brahm, G. (2013). Wie viele Schuljahre bis zum Abitur? – Eine multiperspektivische Standortbestimmung im Kontext der aktuellen Schulzeitdebatte . Zeitschrift für Erziehungswissenschaft, 16(1), 115-136. (Online)
  • Laging, R., Böcker, P., & Dirks, F. (2014). Zum Einfluss der Schulzeitverkürzung (G8) auf Bewegungs-und Sportaktivitäten von Jugendlichen. Sportunterricht, 63(3), 66-72. (Online)
  • Marcus, J., & Zambre, V. (2017). Folge der G8-Schulreform: Weniger Abiturientinnen und Abiturienten nehmen ein Studium auf. DIW Wochenbericht, 84(21), 418-426. (Online)
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Meyer, T. (2016). An evaluation of the shortened high school duration in Germany and its impact on postsecondary education and labor market entry. Gottfried Wilhelm Leibniz Universität Hannover. (Online)
  • Meyer, T., & Thomsen, S. L. (2015). Schneller fertig, aber weniger Freizeit?–Eine Evaluation der Wirkungen der verkürzten Gymnasialschulzeit auf die außerschulischen Aktivitäten der Schülerinnen und Schüler. Schmollers Jahrbuch, 135, 249-278. (Online)