Archiv der Kategorie: Lehrerbildung in den Medien

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 4/12 – Teil 3

Todsünde Nr. 3: Zu viele unausgereifte Reformen im Bildungssystem

In einer Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei wird betrachtet, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Grundsätzlich ist daher hilfreich, das entsprechende Buchkapitel gelesen zu haben, was ich auch an dieser Stelle ausdrücklich empfehlen möchte. Dies ist der dritte Teil eines Beitrags, der sich mit der dritten vom Autoren so bezeichneten Todsünde beschäftigt. Thesen aus dem Buch werden im Konjunktiv wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll, sondern einfach den Regeln zur indirekten Rede folgt. Im ersten Teil wurde die Kernthese des zugehörigen Buchkapitels genauer beschrieben: zusammengefasst würden im Bildungssystem zu viele Veränderungen vorgenommen , ohne vorher ausreichend erprobt und/oder danach ausreichend evaluiert zu werden. Heinz-Peter Meidinger beschreibt hierfür drei Beispiele von Reformen näher, die sich aus seiner Sicht besonders negativ ausgewirkt hätten. Im ersten Teil ging es um das Konzept „Lesen lernen durch Schreiben“, im zweiten Teil um den frühen Fremdsprachenunterricht in der Grundschule. In diesem dritten und dem noch folgenden vierten Teil geht es um die Einführung von Bachelor- und Masterstudiengängen in Deutschland im Zuge des so genannten Bologna-Prozesses. Die von Heinz-Peter Meidinger hierzu angesprochenen Aspekte sind so umfangreich, dass ich sie für eine bessere Lesbarkeit in zwei Blogbeiträge aufgeteilt habe.

Worum geht es eigentlich genau?

Bildnachweis: Bologna-Kommission, gemeinfrei

1997 schlossen der Europarat und die UNESCO einen ersten völkerrechtlichen Vertrag, in dem vereinbart wurde, Hochschulzugangsberechtigungen, Studienabschlüsse und Studienleistungen, die in den Unterzeichnerstaaten erworben wurden, prinzipiell gegenseitig anerkennen zu wollen (zusammenfassend als Lissabon-Konvention bezeichnet). Bei solchen Anerkennungen stecken aufgrund unterschiedlicher Bildungssysteme die Schwierigkeiten natürlich im Detail. Eine zentrale Einschränkung ist bspw., dass die zuständigen Behörden eines Landes sich vorbehalten dürfen, erbrachte Leistungen selbst zu bewerten und auch nur diese Bewertung anerkennen müssen. So kann z.B. entschieden werden, dass vor der Einschreibung in einen Studiengang in einem anderen Land erst noch weitere Zusatzqualifikationen erbracht werden müssen (z.B. vorbereitende Kurse, Aufnahmeprüfungen). Um die Vergleichbarkeit von Leistungen zu erleichtern, beschlossen 1999 29 europäische Länder, die Hochschulstrukturen in Europa zu harmonisieren bzw. besser aneinander anzupassen (zusammenfassend als Bologna-Prozess bezeichnet; Bologna-Erklärung, 1999). Das stieß eine ganze Reihe an Entwicklungen an, die sich natürlich je nach Ausgangslage zwischen den europäischen Ländern unterschieden.

Eine zentrale Veränderung ist, dass europaweit eine Studienstruktur umgesetzt wurde bzw. immer noch wird, die drei Zyklen der Hochschulbildung umfasst (KMK, 2016, 2003; HRK, 2004): im ersten Schritt den Erwerb einer Bachelor-Qualifikation, im zweiten eine Master-Qualifikation und im dritten Schritt ein Promotionsstudium. Jeder Zyklus endet mit einem definierten, eigenen Abschluss. Um den nötigen Umfang für die ersten beiden Abschnitte zu definieren, wurde das European Credit Transfer System entwickelt (dies ist der Ursprung der ECTS-Punkte an Hochschulen). Für deutsche Hochschulen bedeutete dies eine relativ große Umstellung, die nun – für die meisten Hochschulen erstmals – neue, zwei-stufige Studienprogramme entwickeln mussten, eben die besagten Bachelor- und Masterstudiengänge (Pietzonka, 2014; vgl. Klomfaß, 2011; Brändle, 2010). Zuvor existierten bspw. mit den Diplom-Studiengängen an vielen Universitäten Programme, in denen ein Abschluss erst am Ende eines längeren einphasigen Studienverlaufs erworben werden konnte (in diesem Sinne waren sie also nicht gestuft) und die auch nicht unbedingt kompatibel mit den beschlossenen Studienumfängen nach dem ECTS-System waren. Auch, wenn man sagen kann, dass der Großteil aktueller Studienprogramme in Deutschland diesem Zyklus-Modell entspricht (HRK, 2023), gibt es noch einige Bereiche, in denen bisher nur wenige Umstellungen erfolgt sind (vgl. Schütz & Röbken, 2019). Das gilt z.B. für Jura- und Medizin-Studiengänge, die immer noch weitestgehend dem Staatsexamensmodell folgen (HRK, 2023; vgl. Konzen, 2010). Hauptziel dieser Veränderungen auf formaler Ebene war natürlich, dass die Anerkennung von Hochschulqualifikationen vereinfacht wird. Damit verbunden waren und sind allerdings auch eine Reihe weiterer, damit zusammenhängender Ziele, wie die Erleichterung der Mobilität von Studierenden und Absolvent*innen (z.B. Wechsel des Studienorts in ein anderes Land, Auslandssemester), die europaweit gemeinsame Entwicklung und Arbeit an Qualitätsstandards für Studiengänge oder auch das Ziel, mehr Personen außerhalb Europas als Studierende zu gewinnen (vgl. Gehmlich, 2013; Brändle, 2010).

Was wird kritisiert?

Heinz-Peter Meidinger bezieht sich in seiner so bezeichneten dritten Todsünde der Schulpolitik auf diesen Veränderungsprozess im Hochschulbildungssystem, auch wenn dies streng genommen keinen direkten Einfluss auf das Schulsystem in Deutschland hat (ob es einen indirekten Einfluss hat bzw. haben sollte, ist allerdings eine diskutierte Streitfrage, vgl. Klomfaß, 2013). Er nennt die Einführung als Beispiel für eine „weitgehend misslungene Reform“ (Meidinger, 2021, 58) und gibt hierfür folgende Gründe an:

  1. Die Studienzeiten von Studierenden hätten sich nicht verkürzt, weil die meisten Bachelorabsolvent*innen auch ein Masterstudium begönnen. Dies läge auch an schlechten Berufs- und Verdienstaussichten nur mit einem Bachelorabschluss.
  2. Die Mobilität Studierender, einen Teil ihres Studiums im Ausland zu absolvieren (Auslandssemester) hätte nicht zugenommen.
  3. In Bachelorstudiengängen würde ein größerer Anteil Studierender ihr Studium abbrechen, als in nicht-gestuften Studiengängen vor dem Bologna-Prozess.
  4. Über die Qualität gestufter Studiengänge „gibt es vielfach Klagen“ (Meidinger, 2021, 59).

Anzumerken ist, dass die Verkürzung der Studienzeiten (Grund 1) und die Verringerung von Studienabbrüchen (Grund 3) kein offizielles Ziel des Bologna-Prozesses sind, mit dem ja primär die verbesserte gegenseitige Anerkennung und Harmonisierung von Hochschulqualifikationen angestrebt wird. Sie finden sich zumindest nicht als Zielformulierungen in der Bologna-Erklärung selbst (Bologna-Erklärung, 1999) und auch nicht in den selbst formulierten Zielen der (jeweiligen) Bundesregierungen, die die Umsetzung jeweils fortgeführt haben (vgl. Deutscher Bundestag, 2021). Das hat auch mich zunächst überrascht, da in Presseberichten über den Bologna-Prozess zu verschiedenen Zeiten insbesondere die Verkürzung der Studienzeit wie selbstverständlich als Ziel genannt wird (vgl. Winter, 2018; Zeit Online, 2014). Diese Diskrepanz lässt sich wahrscheinlich durch zwei Aspekte erklären, wie die Einführung der gestuften Studiengänge in Deutschland ausgestaltet wurde (HRK, 2008; 2004). Der erste Aspekt ist die vereinbarte Rahmenkonzeption der für Deutschland damals neuen Bachelor-Studiengänge. Bspw. wurde in einem Beschluss der KMK (2003) (bezeichnet als „10 Thesen zur Bachelor- und Masterstruktur in Deutschland“) formuliert:

„Als Regelabschluss eines Hochschulstudiums setzt der Bachelor ein eigenständiges
berufsqualifizierendes Profil voraus, das durch die innerhalb der Regelstudienzeit zu
vermittelnden Inhalte deutlich werden muss.“

KMK (2003, 2)

Ein Bachelor wurde also konzeptuell als Abschluss für ein eigenständig qualifizierendes Studienprogramm gedacht. Kombiniert mit den europäisch beschlossenen ECTS-Vorgaben zum Umfang, die einer Regelstudienzeit von drei bis maximal vier Jahren entsprechen, wurde dies im Vergleich zu den vorher an den Universitäten verbreiteten Abschlüssen, die erst nach längeren Regelstudienzeiten erworben werden sollten, als Verkürzungsziel interpretiert (z.B. Banscherus et al., 2009). Dabei wird aber implizit angenommen, dass ein Bachelorstudium genau die gleichen Qualifikationen ermöglichen müsste, wir z.B. ein Diplomstudiengang. Der zweite Aspekt könnte darin liegen, dass in Deutschland schon vor dem Bologna-Beschluss die Einrichtung konsekutiver, also gestufter Studiengänge vorgeschlagen wurde, und die Verkürzung der Studienzeit und damit verbunden, die frühere Verfügbarkeit von Absolvent*innen auf dem Arbeitsmarkt, dabei als potentieller Vorteil benannt wurde (vgl. Brändle, 2010; Terbuyken, 2002). An diese Argumentationen schloss sich bspw. auch die KMK (2003) an, indem formuliert wurde, dass gestufte Studiengänge „zu kürzeren Studienzeiten, deutlich höheren Erfolgsquoten sowie zu einer nachhaltigen Verbesserung der Berufsqualifizierung und der Arbeitsmarktfähigkeit der Absolventen bei[tragen]“ (KMK, 2003, 2) würden. Direkt als Ziel oder Gestaltungsbedingung formuliert wird aber einer Verkürzung nicht. Auch eine Verringerung von Abbruchquoten als Ziel wird nur indirekt angedeutet. Generell gilt aber, dass – wie es für komplexe Veränderungsprozesse auf Systemebene typisch ist – Ziele generell eher weit und diffus formuliert werden (vgl. Klomfaß, 2011; Brändle, 2010). Der ökonomische Fokus auf den Erwerb von Berufsfähigkeit und schnelleren Abschlüssen ist an sich kein primäres Ziel des Bologna-Prozesses, sondern wurde eher in konkreten der Ausgestaltung in Deutschland zum Thema (vgl. Teichler, 2011). Da mit der Entwicklung von Bachelorstudiengängen, auch eine große inhaltliche Neu-Konzeption angestrebt wurde, ist aber zumindest diskutierbar, inwiefern ein Vergleich von Studienzeiten und Abbruchquoten ein geeignetes Maß für den Erfolg von Veränderungen im Hochschulsystem ist.

Die Erhöhung der Mobilität im (und nach) dem Hochschulstudium (Grund 3) ist hingegen auch ein offizielles Ziel des Bologna-Prozess (vgl. Deutscher Bundestag, 2021). Dass über die Qualität von Studiengängen geklagt würde (Grund 4), ist aus meiner Sicht kein besonderes Merkmal für gestufte Studiengänge. Klagen über die Qualität von Studiengängen treten unabhängig von der Struktur auf Systemebene so gut wie immer auf und Klagen können sich auf die unterschiedlichsten Aspekte beziehen. Sind es die z.B. Breite des Veranstaltungsangebots, die Prüfungs-Belastung oder die Studienbedingungen (vgl. Schulmeister & Metzger, 2011)? Trotz dieser Unklarheiten bzgl. der vier genannten Gründe, lässt sich zusammenfassend festhalten, dass die von Heinz-Peter Meidinger genannten Kritikpunkte im Zuge des Bologna-Prozesses auch schon vielfach genannt wurden bzw. an verschiedenen Stellen in ähnlicher Form aufgetreten sind (z.B. Winter, 2018; Kühl, 2018; Banscherus et al., 2009). Im Folgenden werden wir daher einen Blick darauf werfen, welche Erkenntnisse aus der empirischen Bildungsforschung die genannten Vermutungen stützen oder nicht. Dabei konzentrieren wir uns auf Forschungen für den deutschen Hochschulkontext, auf den sich auch Heinz-Peter Meidinger bezieht. Anzumerken ist zunächst, dass die Forschungs- und Quellenlage zum Bologna-Prozess eher unübersichtlich und diffus ist. Im Folgenden kann daher auch nur ein kurzer Überblick gegeben werden. Dabei orientiere ich mich in der Reihenfolge an den Thesen von Heinz-Peter Meidinger. Sollten Untersuchungen nicht dabei sein, die aber zur Beurteilung der angesprochenen Kritikpunkte zentral sein, freue ich mich über eine kurze Benachrichtigung per E-Mail..

Gut Ding will Weile haben

Welchen Einfluss hatte die Einführung gestufter Studiengänge auf die Zeit, die Studierende bis zum Studienabschluss aufwenden? Um diese Frage zu beantworten, muss zunächst festgelegt werden, was genau mit Studienzeit gemeint ist. Zum einen kann damit der Zeitraum betrachtet werden, die Studierende in einem Studiengang verbringen, bspw. wie lange sie von Beginn eines Studiums bis zum Erwerb des Abschlusses benötigen. Aus dieser Perspektive wird Studienzeit innerhalb eines Studiengangs betrachtet (z.B. ob Studierende einen Bachelorabschluss in kürzerer oder längerer Zeit als die Regelstudienzeit erwerben). Zum anderen kann damit der Zeitraum gemeint sein, den eine Person insgesamt benötigt, bis sie die gesamte, individuelle Hochschulausbildung abgeschlossen hat. Nach dieser Perspektive könnte die Studienzeit bspw. die gesamte benötigte Zeit für ein Bachelor- und ein zusätzliches nachfolgendes Masterstudium bis zum Abschluss umfassen. Personen, die nach dem Bachelorstudium kein Masterstudium anschließen, hätten in dieser Perspektive also eine kürzere Studienzeit. Je nach Perspektive, würde ein Vergleich der „neuen“ gestuften Studiengänge mit den „alten“ einphasigen Studiengängen ein etwas anderes Vorgehen erfordern. Bzgl. der ersten Perspektive könnte man für einen Vergleich prüfen, wie stark die Studierenden im Durchschnitt von der jeweils vorgesehenen Studienzeit abweichen. Bzgl. der zweiten Perspektive könnte man die durchschnittliche Gesamtzeit der individuellen Hochschulausbildung betrachten und prüfen, inwiefern sie sich zwischen den Strukturen unterscheiden.

Welche Erkenntnisse zur Studienzeit bzgl. der Veränderungen der Studienstrukturen liegen vor? Laut dem aktuellsten nationalen Bildungsbericht von 2022, der sich auf Daten der amtlichen Statistik bezieht, schließt ein Drittel der Studierenden ein Studium in Regelstudienzeit ab (Autor:innengruppe Bildungsberichterstattung, 2022). Die meisten Bachelorstudiengänge an Universitäten haben eine Regelstudienzeit von sechs Semestern (vgl. HRK, 2023), der Abschluss wird allerdings nach durchschnittlich 7,9 Semestern erreicht. Dabei hat sich die durchschnittliche Studiendauer bis zum Bachelorabschluss hin zu längeren Zeiten entwickelt. Von im Jahr 2006 im Durschnitt 6,9 Semestern, über 6,5 Semester in 2010, 7,2 im Jahr 2014 und 7,8 Semester im Jahr 2014 (Autor:innengruppe Bildungsberichterstattung, 2022; 2020; 2018; 2016). An Hochschulen für angewandte Wissenschaften (HAW) erwerben Studierende nach durchschnittlich 7,5 Semestern einen Bachelorabschluss, dort beträgt die Regelstudienzeit aber meist zwischen sieben und acht Semestern (Autor:innengruppe Bildungsberichterstattung, 2022; vgl. HRK, 2023). Dabei bestehen große Unterschiede zwischen den Studierenden unterschiedlicher Fächergruppen. So ist bspw. der Anteil an Studierenden in Regelstudienzeit in den Fächergruppen Medizin und Wirtschafts-, Rechts- und Sozialwissenschaften höher (Autor:innengruppe Bildungsberichterstattung, 2022; Online-Anhang). Bspw. untersuchte Dietrich (2016) bspw. den längsschnittlichen Studienverlauf von Lehramtsstudierenden an der Universität Leipzig mit Studienbeginn ab Wintersemester 2006/2007 (n=342, Staatsexamen) und 2007/2008 (n=208, Bachelor- und Masterstudiengänge). Dabei ergab sich, dass 46,6% der Studierenden der Bachelor- und Masterstudiengänge ihr Studium in Regelstudienzeit absolvierten, im Vergleich zu 1,2% der Studierenden in den Staatsexamensstudiengängen. Die durchschnittliche Überschreitung betrug im Staatsexamen 3,3 Semester, im Bachelor-Master-System 1,1 Semester.

Hat sich durch die Einführung von gestuften Bachelor- und Masterstudiengängen nun die Zahl von Studierenden erhöht, die länger als die geplante Regelstudienzeit brauchen? Grundsätzlich war es auch vor der Bologna-Reform so, dass ein hoher Anteil Studierender für die einphasigen Studiengänge eine längere Zeit benötigte, als in den Studienplänen vorgesehen. In einer Untersuchung des Wissenschaftsrates zur Entwicklung der Fachstudiendauer an Universitäten von 1990 bis 1998 wird bspw. konstatiert, „daß unter den 132 Diplom- (U), Diplom- (KH) und
Magisterstudiengängen […], nur 11 Studiengänge einen Absolventenanteil innerhalb der Höchstförderungsdauer des BAföG von über 50 % erreichen. In 74 Studiengängen hat auch 2 Semester später noch nicht die Hälfte der Absolventen ihr Studium beendet. In 76 Studiengängen liegt der Median der Fachstudiendauer um mehr als 2 Semester über der Höchstförderdauer.“
(Wissenschaftsrat, 2001, 10f.). Anzumerken ist, dass als Höchstförderungsdauer gemäß BAföG (Bundesausbildungsförderungsgesetz) zum damaligen Zeitpunkt meist die Regelstudienzeit inklusive einem weiteren Semester angenommen wurde. Bzgl. der Studiendauer bezogen auf die Regelstudienzeit hat sich also durch die Einführung der „neuen“ Studiengänge grundsätzlich eher wenig verändert. Dass Studiengänge nicht in der formal geplanten Zeit beendet werden, ist also ein Phänomen, dass auch vor der Bolognareform schon verbreitet war.

Wie hat sich durch die Einführung der gestuften Studiengänge aber auf die Gesamtstudierdauer ausgewirkt? Generell gilt: an Universitäten nehmen gut zwei Drittel der Studierenden nach dem Bachelorabschluss ein Masterstudium auf (eine so genannte Übergangsquote von ca. 66% für den Prüfungsjahrgang 2018; Autor:innengruppe Bildungsberichterstattung, 2022). Auf Basis von Daten der amtlichen Statistik haben Studierende an Universitäten im Jahr 2000 ein Diplomstudium nach durchschnittlich 12,7 Semestern abgeschlossen (Autor:innengruppe Bildungsberichterstattung, 2016), für den Abschluss eines Masters betrug die gesamte durchschnittliche Studiendauer bspw. 11,2 Semester im Jahr 2012, 12,1 Semester im Jahr 2016 und 13,3 Semester im Jahr 2020 (Autor:innengruppe Bildungsberichterstattung, 2016; 2020; 2022). Für noch bestehende Diplomstudiengänge betrug die Studiendauer im Jahr 2018 im Durchschnitt übrigens 12,7 Semester (Autor:innengruppe Bildungsberichterstattung, 2020). Ähnliches gilt auch spezifisch nur für Lehramtsstudiengänge. Im Jahr 2000 machten Lehramtsstudiengänge im Durchschnitt nach 11,4 Semestern einen Abschluss, im Jahr 2014 nach 11,2 Semestern (Autor:innengruppe Bildungsberichterstattung, 2016) und 11,6 Semester im Jahr 2018 (Autor:innengruppe Bildungsberichterstattung, 2020), wobei hier natürlich Lehramtsstudiengänge für alle Zielschulformen zusammengefasst sind (z.B. Grundschule und berufliche Schulen). Auch ältere Untersuchungen zeigen schon ähnliche Studienzeiten für die einphasigen Studiengänge (z.B. Wissenschaftsrat, 2001).

Bildnachweis: Autor:innengruppe Bildungsberichterstattung, 2022, 212; lizenziert unter CC-BY-SA 3.0 DE

Generell ist es also so, dass sich nach der Einführung der „neuen“ Studiengänge, die Gesamtstudiendauern kaum verändert haben, mit einer Tendenz zu längeren Zeiten in den letzten sechs Jahren. Die Unterschiede zwischen Studiengängen und Fächern innerhalb der einzelnen Studienformen sind meist größer, als die Unterschiede zwischen der Studienzeit verschiedener Abschlussarten. Wie man diesen Umstand bewertet, ist eine Frage der Erwartung. Die Studiendauer bis zum Bachelorabschluss ist kürzer als z.B. zum Diplom. Heinz-Peter Meidinger stimme ich insofern zu, als dass zumindest an Universitäten die meisten Studierenden auch einen Masterabschluss zusätzlich anstreben und sich kombiniert keine Veränderung der mittleren Studienzeit ergeben hat. Das war aber auch zumindest kein offizielles Ziel des Bologna-Prozesses.

Was bringt der Bachelor?

Liegen die Gründe dafür, dass die meisten Studierenden mit einem Bachelorabschluss auch ein Master-Studium beginnen an schlechten Berufs- und Verdienstaussichten? Auch zu dieser Frage liegen einige Ergebnisse empirischer Untersuchungen vor. Auch hier können zunächst Analysen auf Basis amtlicher statistischer Daten herangezogen werden. Grundsätzlich ist es so, dass Personen mit einem Hochschulabschluss (egal welcher), im Durchschnitt höhere Einkommen erzielen, seltener von Arbeitslosigkeit betroffen sind und häufiger Führungspositionen ausüben als Personen mit einem anderen beruflichen Qualifikationsnachweis (Autor:innengruppe Bildungsberichterstattung, 2018). Um Unterschiede im beruflichen Verbleib nach Abschlussart abzubilden, wird bspw. im Bildungsbericht 2022 unterschieden, welches Anforderungsniveau ausgeübte Berufe erfordert. Dabei wird zwischen Expert*in, Spezialist*in, Fachkraft und Helfer*in differenziert. Das Anforderungsniveau Expert*in und Spezialist*in werden dabei als ausbildungsadäquate Berufsplatzierung für Personen mit Hochschulabschluss betrachtet. Dabei zeigt sich, dass 85% der Absolvent*innen in einem Beruf arbeiten, die dem ausbildungsadäquaten Anforderungsniveau entspricht, mit Masterabschluss sind es 89%, mit „nur“ Bachelorabschluss sind es 80% (Autor:innengruppe Bildungsberichterstattung, 2022, 217). Es gibt also bzgl. dieses Maßstabs einen, allerdings kleinen, Unterschied.

Unterschiede zeigen sich auch bzgl. des von Absolvent*innen mit verschiedenen Studienabschlüssen erzielten Einkommens. Bspw. nutzten Neugebauer & Weiss (2017) Daten des Mikrozensus 2010 und 2013 und betrachteten insbesondere Berufseinsteiger*innen, also Hochschulabsolvent*innen, deren Abschluss maximal sechs Jahre zurücklag. Diese Gruppen wurden auch mit Personen verglichen, die anderweitig Qualifikationen erworben haben (z.B. Ausbildung, Meister). Je nach Analyseschwerpunkt ergab sich eine Stichprobe zwischen von N =30.137 bis 34.940 Personen. In Regressionsanalysen zeigte sich, dass Masterabsolvent*innen unter Kontrolle der Fachdomäne ein signifikante höheres monatliches Einkommen angaben als Bachelorabsolvent*innen (ca. 14%). Diese gaben aber ein höheres Einkommen als Personen mit Ausbildungsabschlüssen an, mit Meisterabschluss war das Einkommen ähnlich hoch. Abschlüsse von HAWs gingen mit etwas höheren Einkommen einher als die Äquivalente von Universitäten. Ein ähnliches Muster ergab sich bzgl. des empfundenen Berufsprestiges mit etwas geringeren Unterschieden. Bachelorabsolvent*innen von Universitäten hatten aber die größte Wahrscheinlichkeit, von Arbeitslosigkeit betroffen zu sein und befristete Arbeitsverträge zu erhalten.

Trennt (2019) untersuchte anhand von Daten der ersten Befragungswelle des Deutsches Zentrum für Hochschul- und Wissenschaftsforschung (DZHW), inwiefern sich Unterschiede im nach Angaben der Absolvent*innen (N=2043) im weiteren Berufsverlauf erzielten Einkommen durch die Art ihres Studienabschlusses (Bachelor- oder Masterabschluss) erklären lassen. Im Nullmodell der Regressionsanalysen ergab sich, dass die Art des Abschlusses ein signifikanter Prädiktor ist (MA-Absolvent*innen verdienten nach Eigenangabe ca. 14% mehr), aber allein nur 2,8% der Varianz aufklärt. Werden weitere Variablen kontrolliert, die das erzielte Einkommen ebenfalls erklären können (z.B. Arbeitsort, Branche, vorherige Ausbildung, BA- bzw- MA-Note, Arbeitsmarktstruktur, Ausbildungsadäquanz, Fach u.v.a.), vergrößert sich der Unterschied zwischen den Absolvent*innengruppen sogar noch etwas (ca. 16% Einkommensunterschied). Insgesamt werden durch alle einbezogenen Variablen 36,7% der Unterschiede erklärt. Dabei wird deutlich, dass Einkommensunterschied durch ein komplexes Zusammenwirken vieler Faktoren erklärt werden kann. „Demnach verdienen Bachelorabsolventinnen und -absolventen auch deswegen weniger, weil sie häufiger Tätigkeiten ausüben, für die sie überqualifiziert sind.“ (Trennt, 2019, 391; vgl. auch Grotheer, 2019). Ob dies aber z.B. daran liegt, dass BA-Absolvent*innen ihre Tätigkeiten eher zur Überbrückung zum Masterstudium ausüben, konnte durch die Daten nicht geklärt werden.

Ähnliche Unterschiede zwischen beiden Absolvent*innengruppen werden auch in anderen Untersuchungen berichtet (Hall, 2021; Fabian et al., 2016; Spangenberg & Quast, 2016; Konegen-Grenier, Placke & Schröder-Kralemann, 2015). Auch Analysen, in denen Studierenge mit „alten“, einphasigen Diplomabschlüssen einbezogen wurden, zeigen, dass Bachelorabsolvent*innen im Vergleich geringere Einkommen erzielen (Rehn et al., 2011), wobei die Größe des Unterschieds stark von den studierten Fächern abhing (Müller & Reimer, 2015). Zu beachten ist bei diesen Ergebnissen allerdings auch, dass im Zeitverlauf zum anderen der Anteil von Berufsanfänger*innen, die einen Hochschulabschluss erworben hat, insgesamt gestiegen ist (Autor:innengruppe Bildungsberichterstattung, 2022, 77f.), also insgesamt mehr Personen mit einem solchen Abschluss auf dem Arbeitsmarkt nach Stellen suchen. Dementsprechend werden nun auch vermehrt Personen mit „neuen“ Abschlüssen eingestellt (Briedis et al., 2011). Daher können sich Ergebnisse auch im Zeitverlauf ändern bzw. Erkenntnisse zum „Wert“ von Abschlüssen hängen natürlich auch davon ab, in welchen Jahren der Abschluss erworben wurde. Basierend auf den vorliegenden Untersuchungen sind die Verdienst- und Beschäftigungsaussichten von reinen Bachelorabsolvent*innen aber tatsächlich etwas schlechter als von Absolvent*innen mit anderen Hochschulabschlüssen, wie auch Heinz-Peter Meidinger impliziert.

Ist dieser Unterschied aber auch ein Grund für Studierende, nach dem Bachelorabschluss eher ein Masterstudium aufzunehmen (vgl. Johnson, 2013)? Zur Frage, aus welchen Motiven heraus Studierende ein Studium aufnehmen, liegen auch einige empirische Erkenntnisse vor. Lörz et al. (2019) untersuchten mit Hilfe von Daten des DHZW-Studienberechtigtenpanels (N=2667 Personen, die 2010 die Studienberichtigung erworben haben), wie bestimmte motivationale Orientierungen, Zielvorstellungen und die Entscheidung, nach einem Bachelorabschluss ein Masterstudium aufzunehmen zusammenhängen. Dabei wurde zu verschiedenen Zeitpunkten eine Reihe von Variablen erfasst (z.B. Schul- und Studienleistungen, eingeschätzte Kosten, erwartete immaterielle und materielle Erträge, Merkmale der Bildungsbiografie, familiäre Rahmenbedingungen etc.). In logistischen Regressionsanalysen ergab sich, dass viele dieser Merkmale signifikante Prädiktoren für die Entscheidung für ein Masterstudium bilden, allerdings meist mit einem ähnlich kleinen Effekt. Die größten Effekte hatten das studierte Fach (Lehramt, Natur- und Ingenieurswisseschaften) und ob der Bachelor an einer Universität erworben wurde. Erwartete Opportunitätskosten hatten nur einen eher kleinen Effekt auf die Entscheidung gegen ein Masterstudium im Anschluss (β=-0,02). Diese komplexe Motivlage für das Aufnehmen eines Masterstudiums wird auch in anderen Untersuchungen herausgestellt (z.B. Köck & Zach, 2022; Kretschmann et al., 2017; Lörz et al., 2015; Auspurg & Hinz, 2011). Die geringen Verdienstaussichten allein sind für die meisten Studierenden daher anscheinend nicht der ausschlaggebendste Grund bzw. es hängt sehr stark vom studierten Fach ab, wie sehr dieses Motiv ein Grund ist.

Für das Lehramtsstudium, mit dem wir uns hier im Blog hauptsächlich beschäftigen, ist es relativ klar, warum sich die meisten Studierenden mit einem Bachelorabschluss auch für ein Masterstudium entscheiden (ca. 90%; Autor:innengruppe Bildungsberichterstattung, 2018). In allen Bundesländern berechtigt schlicht nur ein Masterabschluss zur Aufnahme des Vorbereitungsdiensts bzw. des Referendariats (vgl. Möller, Bauer & Zimmermann, 2023). Aufgrund dieses Umstands wurde und wird auch für das Lehramtsstudium weiterhin diskutiert, wie eine gestufte Studienstruktur am besten ausgestaltet werden, wie diese verändert werden sollte (vgl. Schmees, 2020; Helsper & Kolbe, 2002; Herrmann, 2001). Übrigens nehmen auch nach erfolgreichem Masterstudium nicht alle Lehramtsstudierenden den Vorbereitungsdienst auf. Bei Analysen auf Basis des Nationalen Bildungspanels konnten Gülen, Müller & Schmid-Kühn (2023) feststellen, dass nach dem Masterabschluss 16% der Lehramtsabsolvent*innen einen Beruf außerhalb des Lehramtes ausüben oder ein Promotionsstudium aufnehmen.

So weit, so gut…

In diesem Beitrag haben wir uns mit der ersten Begründung Heinz-Peter Meidingers, warum er die Einführung von Bachelor- und Masterstudiengängen als eine nicht gelungene Reform nennt, aus der Perspektive der empirischen Bildungsforschung beschäftigt. Aus Gründen des Umfangs und für eine bessere Lesbarkeit werden die übrigen drei Gründe bzw. Thesen (keine Erhöhung der internationalen Mobilität im Studium, höhere Abbruchquoten, Klagen über Qualität) im vierten und letzten Teil zu seiner Todsünde der Schulpolitik Nr. 3 betrachtet. Er wird an dieser Stelle verlinkt, sobald er online zugänglich ist.

Literatur:

  • Autor:innengruppe Bildungsberichterstattung (2016). Bildung in Deutschland 2016 – Ein indikatorengestützter Bericht mit einer Analyse zu Bildung und Migration. wbv. (Online)
  • Autor:innengruppe Bildungsberichterstattung (2018). Bildung in Deutschland 2018 – Ein indikatorengestützter Bericht mit einer Analyse zu Wirkungen und Erträgen von Bildung. wbv. (Online)
  • Autor:innengruppe Bildungsberichterstattung (2020). Bildung in Deutschland 2020 – Ein indikatorengestützter Bericht mit einer Analyse zu Bildung in einer digitalisierten Welt. wbv. (Online)
  • Autor:innengruppe Bildungsberichterstattung (2022). Bildung in Deutschland 2022 – Ein indikatorengestützter Bericht mit einer Analyse zum Bildungspersonal. wbv. (Online)
  • Auspurg, K., & Hinz, T. (2011). Master für alle? Der Einfluss sozialer Herkunft auf den Studienverlauf und das Übertrittsverhalten von Bachelorstudierenden. Soziale Welt, 62(1), 75-99. (Online)
  • Banscherus, U., Gulbins, A., Himpele, K., & Staack, S. (2009). Der Bologna-Prozess zwischen Anspruch und Wirklichkeit – Die europäischen Ziele und ihre Umsetzung in Deutschland – Eine Expertise im Auftrag der Max-Traeger-Stiftung. GEW. (Online)
  • Bologna-Erklärung (1999). Der Europäische Hochschulraum – Gemeinsame Erklärung der Europäischen Bildungsminister Juni 1999. Bologna. (Online)
  • Brändle, T. (2010). 10 Jahre Bologna-Prozess. Springer VS. (Online)
  • Briedis, K., Heine, C. Konegen-Grenier, & Schröder A-K. (2011). Mit dem Bachelor in den Beruf – Arbeitsmarktbefähigung und -akzeptanz von Bachelorstudierenden und -absolventen. Stifterverband für die Deutsche Wissenschaft. (Online)
  • Briedis, K., Klüver, S., & Trommer, M. (2016). Zwischen Etablierung, Stabilisierung und Aufstieg: Berufliche Entwicklung der Hochschulabsolvent(inn)en 2009. Forum Hochschule 4|2016. DZHW. (Online)
  • Deutscher Bundestag (Hrsg.) (2021). Bericht der Bundesregierung über die Umsetzung der Ziele des Bologna-Prozesses 200 bis 2020. Drucksache 19/27965. (Online)
  • Dietrich, S. (2016). Lehrerbildung in Sachsen–modularisiert zum Erfolg? Effektivität der Bachelor/Master-Lehrerausbildung am Beispiel der Universität Leipzig. DDS–Die Deutsche Schule108(1), 93-106. (Online)
  • Fabian, G., Hillmann, J., Trennt, F. & Briedis, K. (2016). Hochschulabschlüsse nach Bologna. Werdegänge der Bachelor- und Masterabsolvent(inn)en des Prüfungsjahrgangs 2013. Forum Hochschule 1|2016. DZHW. (Online)
  • Gehmlich, V. (2013). Die Bologna Reform–Ein europäischer Hochschul(t)raum?. In S. Claus, & M. Pietznonka (Hrsg.), Studium und Lehre nach Bologna: Perspektiven der Qualitätsentwicklung (S. 97-106). Springer. (Online)
  • Grotheer, M. (2019). Berufseinstieg und Berufsverlauf mit Bachelorabschluss. Wie erfolgreich etablieren sich Graduierte verschiedener Abschlussarten am Arbeitsmarkt?. In M. Lörz, & H. Quast (Hrsg.), Bildungs-und Berufsverläufe mit Bachelor und Master: Determinanten, Herausforderungen und Konsequenzen (S. 437-479). Springer. (Online)
  • Gülen, Ș., Müller, K., & Schmid-Kühn, S. M. (2023). Lehramtsstudium–Vorbereitungsdienst–Lehrkräfteberuf, oder? Empirische Analysen aus dem Nationalen Bildungspanel (NEPS). ZeHf–Zeitschrift für empirische Hochschulforschung6(2), 149-168. (Online)
  • Hall, A. (2021). Alles beim Alten? Bildungserträge höherer beruflicher und akademischer Abschlüsse vor und nach Bologna. KZfSS Kölner Zeitschrift für Soziologie und Sozialpsychologie, 73(4), 527-553. (Online)
  • Helsper, W., & Kolbe, F. U. (2002). Bachelor/Master in der Lehrerbildung—Potential für Innovation oder ihre Verhinderung?. Zeitschrift für Erziehungswissenschaft5, 384-400. (Online)
  • Herrmann, U. (2001). Eine Bachelor-/Master-Struktur für das Universitätsstudium von Gymnasiallehrern. Chancen oder Holzwege?. Zeitschrift für Pädagogik47(4), 559-575. (Online)
  • HRK (Hrsg.) (2004). Bologna-Reader – Texte und Hilfestellungen zur Umsetzung der Ziele des Bologna-Prozesses an deutschen Hochschulen. HRK-Servicestelle Bologna. (Online)
  • HRK (Hrsg.) (2008). Bologna-Reader III – FAQs – Häufig gestellte Fragen zum Bologna-Prozess an deutschen Hochschulen. HRK-Bologna Zentrum. (Online)
  • HRK (Hrsg.) (2023). Statistische Daten zu Studienangeboten an Hochschulen in Deutschland -Studiengänge, Studierende, Absolventinnen und Absolventen – Wintersemester 2023/2024. HRK. (Online)
  • Johnson, M. T. (2013). The impact of business cycle fluctuations on graduate school enrollment. Economics of Education Review34, 122-134. (Online)
  • Kaufmann, B., & Fraij, A. (2013). Studienqualität vor dem Hintergrund des Bologna-Prozesses: ein Vergleich der Studienqualität zwischen Diplom-, Bachelor-und Masterstudierenden der erziehungswissenschaftlichen Studiengänge an der Universität Gießen – Eine querschnittliche Analyse. Institut für Erziehungswissenschaft, Universität Gießen. (Online)
  • Klomfaß, S. (2011). Hochschulzugang und Bologna-Prozess: Bildungsreform am Übergang von der Universität zum Gymnasium. Springer. (Online)
  • Klomfaß, S. (2013). Der Bologna-Prozess–ein Angriff auf den deutschen Königsweg? Ein Blick auf den Hochschulzugang in Deutschland unter den Bedingungen der Europäischen Bildungsreform. In N. Ricken, H-C. Koller, & E. Keiner (Hrsg.), Die Idee der Universität-revisited. (S. 127-141). Springer. (Online)
  • KMK (2003). 10 Thesen zur Bachelor- und Masterstruktur in Deutschland (Beschluss der Kultusministerkonferenz vom 12.06.2003). (Online)
  • KMK (2016). Europäische Studienreform – Gemeinsame Erklärung von Kultusministerkonferenz und Hochschulrektorenkonferenz (Beschluss der Hochschulrektorenkonferenz vom 10.11.2015 sowie der Kultusministerkonferenz vom 08.07.2016). (Online)
  • Köck, V., & Zach, A. (2022). Wohin geht es nach dem Bachelorabschluss? Einblicke in die Ergebnisse einer Studienabschlussbefragung an der Universität Graz. In A. Eder, K. Deman, & S. Aldrian (Hrsg.), Bildungs-und Berufsvorstellungen von Bachelorabsolventen und-absolventinnen: Empirische Analysen anhand von Befragungs-und Registerdaten (S. 13-34). Springer. (Online)
  • Konegen-Grenier, C., Placke, B., & Schröder-Kralemann, A. K. (2015). Karrierewege für Bachelorabsolventen: Ergebnisbericht zur Unternehmensbefragung 2014. Stifterverband. (Online)
  • Konzen, H. (2010). Bologna-Prozess und Juristenausbildung. Juristenzeitung65(5), 241-245. (Online)
  • Kretschmann, J., Gronostaj, A., Schulze, A., & Vock, M. (2017). Wenn sich die Masterfrage stellt: Soziale Herkunftseffekte auf die Übergangsintention nach dem Bachelorstudium. ZeHf–Zeitschrift für empirische Hochschulforschung1(1), 13-14. (Online)
  • Kühl, S. (2018). Verschulung wider Willen. Die ungewollten Nebenfolgen einer Hochschulreform. In N. Hericks (Hrsg.), Hochschulen im Spannungsfeld der Bologna-Reform: Erfolge und ungewollte Nebenfolgen aus interdisziplinärer Perspektive (S. 295-309). Springer. (Online)
  • Lörz, M., Quast, H., & Roloff, J. (2015). Konsequenzen der Bologna-Reform: Warum bestehen auch am Übergang vom Bachelor-ins Masterstudium soziale Ungleichheiten?. Zeitschrift für Soziologie44(2), 137-155. (Online)
  • Lörz, M., Quast, H., Roloff, J., & Trennt, F. (2019). Determinanten des Übergangs ins Masterstudium. Theoretische Modellierung und empirische Überprüfung. Bn M. Lörz, & H. Quast (Hrsg.), Bildungs-und Berufsverläufe mit Bachelor und Master: Determinanten, Herausforderungen und Konsequenzen (S. 53-93). Springer. (Online)
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Möller, J., Bauer, J., & Zimmermann, F. (2023). Das Lehramtsstudium – Angebot, Nutzung, Lernergebnisse. In T. Kauper, A. Bernholt, J. Möller, & O. Köller (Hrsg.), PaLea: Professionelle Kompetenzen und Studienstrukturen im Lehramtsstudium (S. 149-178). Waxmann.
  • Müller, C., & Reimer, M. (2015). Einkommen von Bachelor und Diplomabsolventen: Die Rolle von Fach und Arbeitsmarkt. Beiträge zur Hochschulforschung, 37(2), 88-114. (Online)
  • Neugebauer, M., & Weiss, F. (2017). Does a Bachelor’s Degree pay off?: Labor Market Outcomes of Academic versus Vocational Education after Bologna. School of Business & Economics Discussion Paper 2017/11. FU Berlin. (Online)
  • Pietzonka, M. (2014). Gestaltung von Studiengängen im Zeichen von Bologna. Springer. (Online)
  • Rehn, T., Brandt, G., Fabian, G., & Briedis, K. (2011). Hochschulabschlüsse im Umbruch. Studium und Übergang von Absolventinnen und Absolventen reformierter und traditioneller Studiengänge des Jahrgangs 2009. HIS:Forum Hochschule 17|2011. HIS. (Online)
  • Spangenberg, H., & Quast, H. (2016). Bildungsentscheidungen und Umorientierungen im nachschulischen Verlauf. Dritte Befragung der Studienberechtigten 2010 viereinhalb Jahre nach Schulabschluss. Forum Hochschule 5|2016. DZHW. (Online)
  • Schmees, J. K. (2020). Lehrer* innenbildung und Bologna-Prozess: Politische Strategien zur Einführung der Bachelor-und Masterabschlüsse im Bundesländervergleich. Julius Klinkhardt. (Online)
  • Schütz, M., & Röbken, H. (2018). Präventives Reformieren. Wie und warum „Gallische Dörfer “an Hochschulen das Bologna-Studium ablehnen. N. Hericks (Hrsg.), Hochschulen im Spannungsfeld der Bologna-Reform: Erfolge und ungewollte Nebenfolgen aus interdisziplinärer Perspektive (S. 335-351). Springer. (Online)
  • Schulmeister, R., & Metzger, C. (Hrsg.). (2011). Die Workload im Bachelor: Zeitbudget und Studierverhalten.: Eine empirische Studie. Waxmann. (Online)
  • Teichler, U. (2011). Der Jargon der Nützlichkeit: Zur Employability-Diskussion im Bologna-Prozess. In B. Hölscher, & J. Suchanek (Hrsg.), Wissenschaft und Hochschulbildung im Kontext von Wirtschaft und Medien (S. 165-186). Springer VS. (Online)
  • Terbuyken, G. (2002). Bedingungen und Chancen für konsekutive Studiengänge – Zur Einführung von Bachelor- und Masterstudiengängen in der Sozialarbeit, Evangelische Jugend, 79(2), 81-94. (Online)
  • Trennt, F. (2019). Zahlt sich ein Master aus? Einkommensunterschiede zwischen den neuen Bachelor-und Masterabschlüssen. In M. Lörz, & H. Quast (Hrsg.), Bildungs-und Berufsverläufe mit Bachelor und Master: Determinanten, Herausforderungen und Konsequenzen (S. 371-397). Springer (Online)
  • Winter, M. (2018). Bologna–die ungeliebte Reform und ihre Folgen. In N. Hericks (Hrsg.), Hochschulen im Spannungsfeld der Bologna-Reform: Erfolge und ungewollte Nebenfolgen aus interdisziplinärer Perspektive (S. 279-293). Springer. (Online)
  • Wissenschaftsrat (Hrsg.) (2001). Entwicklung der Fachstudiendauer an Universitäten von 1990 bis 1998. Wissenschaftsrat. (Online)
  • Zeit Online (Hrsg.) (2014). Bachelor-Abschlüsse dauern länger als geplant, Zeit Online, 27. Juli 2014. (Online)

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 4/12 – Teil 2

Todsünde Nr. 3: Zu viele unausgereifte Reformen im Bildungssystem

In einer Artikelreihe beschäftigen wir uns mit dem Buch Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei betrachten wir, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Grundsätzlich ist daher hilfreich, das entsprechende Buchkapitel gelesen zu haben, was ich auch an dieser Stelle ausdrücklich empfehlen möchte. Dies ist der zweite Teil eines Beitrags, der sich mit der dritten vom Autoren so bezeichneten „Todsünde“ beschäftigt. Thesen aus dem Buch werden im Konjunktiv wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll, sondern einfach den Regeln indirekter Rede folgt. Im ersten Teil wurde die Kernthese des zugehörigen Buchkapitels genauer beschrieben: Zusammengefasst würden im Bildungssystem zu viele Veränderungen vorgenommen, ohne vorher ausreichend erprobt und/oder danach ausreichend evaluiert zu werden. Heinz-Peter Meidinger beschreibt insbesondere drei Beispiele von Reformen, die sich aus seiner Sicht besonders negativ ausgewirkt hätten. Meidingers erstes Beispiel, das Konzept „Lesen durch Schreiben“, haben wir im ersten Teil genauer betrachtet. In diesem Beitrag geht es nun um das zweite Beispiel: den (frühen) Fremdsprachenunterricht in der Grundschule.

Fremdsprachen in der Grundschule?

Noch in seiner Funktion als Präsident des Deutschen Lehrerverbandes hat Heinz-Peter Meidinger im Sommer 2023 in verschiedenen Medien die Abschaffung des Englischunterrichts an Grundschulen vorgeschlagen, um stattdessen mehr Zeit für die Leseförderung bzw. den Deutschunterricht aufzuwenden (z.B. Votja, 2023; BR24, 2023). Den frühen Fremdsprachenunterricht hat der Autor auch schon im vorliegenden Buchkapitel negativ betrachtet und dazu ähnliche Argumente angeführt wie in den aktuelleren Interviews. Heinz-Peter Meidinger kritisiert am Fremdsprachenunterricht in der Grundschule verschiedene Aspekte. Zum Ersten den (eventuell) fehlenden Lernerfolg: Bis heute gibt es keine Evaluation, die belegt, dass durch den frühen Fremdsprachenbeginn die fremdsprachliche Kompetenz von Schulabsolventen gestiegen sei“ (Meidinger, 2021, 57). Stattdessen seien Kompetenzen in der Muttersprache geschwächt worden, weil für den Fremdsprachenunterricht der Zeitrahmen für den Deutschunterricht gekürzt worden sei. Zum Zweiten das Fehlen von Bildungsstandards für das frühe Fremdsprachenlernen, auf denen der Unterricht ein weiterführenden Schulen aufbauen könnte. Nach Aussage von Heinz-Peter Meidinger fingen […] die Fremdsprachenlehrkräfte an Gymnasien deshalb nochmals von vorne an“ (Meidinger, 2021, 58), wobei ich vermute, dass auch Lehrkräfte an anderen weiterführenden Schulformen gemeint sind. Zum Dritten sieht er die Annahme kritisch, dass Kinder Fremdsprachen besonders leicht lernen würden, was wie folgt begründet wird:

Der Lernfortschritt ist bei gleichem Zeiteinsatz bei Zehnjährigen höher als bei Sechs- oder Achtjährigen, weil letztere zu systematischem Lernen noch nicht in der Lage sind“

(Meidinger, 2021, 58).

Ich muss zugeben, dass ich dieses Argument nicht ganz verstehe bzw. nachvollziehen kann. Ich vermute, dass sich Heinz-Peter Meidinger hier auf empirische Untersuchungen bezieht, zu denen leider keine Quellenangaben gemacht werden. Wenn Sechs- bis Achtjährige grundsätzlich nicht zu systematischem Lernen in der Lage wären, spräche das dann nicht generell dafür, die Grundschule erst ab einem Alter von neun Jahren zu beginnen? Ich vermute, dass das nicht der Aussageintention des Autors entspricht, es ließe sich aber allein auf Grundlage seines Textes so interpretieren. Zum Vierten wird von Heinz-Peter Meidinger auch kritisiert, dass zu wenige für den Fremdsprachenunterricht ausgebildete Lehrkräfte vorhanden seien.

Englisch auf Kosten der Erstsprache?

Seit 2004 ist die Teilnahme am fremdsprachlichen Unterricht in allen Bundesländern für alle Kinder in der Grundschule verpflichtend, wobei sich die konkrete Ausgestaltung (z.B. Klassenstufe, Umfang) zwischen den Bundesländern unterscheidet und zudem im Laufe der Zeit auch verändert (vgl. KMK, 2013). In Nordrhein-Westfalen wurde verpflichtender Englischunterricht an allen Grundschulen beispielsweise ab dem Jahr 2003 eingeführt (MSB NRW, 2003), konkret mit jeweils zwei Unterrichtsstunden pro Woche in den Klassenstufen 3 und 4 (MSB NRW, 2005). Ging dies zu Lasten anderer Fächer, […] weil die Zusatzstunden auch aus dem Bereich des Deutschunterrichts herausgebrochen wurden“ (Meidinger, 2021, 57)? In der Stundentafel für die Grundschule vor der Einführung waren für die dritte Klasse 23-24 Stunden pro Woche vorgesehen, von denen 14-15 Stunden auf die Fächer Sprache, Sachunterricht, Mathematik sowie Förderunterricht entfallen sollten (MSB NRW, 1996). Für die vierte Klasse waren es insgesamt 24-25 Wochenstunden, davon 15-16 für die genannten Bereiche, also auch das Fach Deutsch. In der Stundentafel nach Einführung des Englischunterrichts waren für die dritte Klasse 25-26 Stunden pro Woche, davon 14-15 Stunden für die Fächer Deutsch, Sachunterricht, Mathematik, Förderunterricht vorgesehen (MSB NRW, 2005). Der Anteil für das Fach Deutsch änderte sich also nicht. Stattdessen wurde das Fach Englisch mit einer zusätzlichen Erhöhung der Gesamtstundenzahl eingeführt (was auch für Klassenstufe 4 zutrifft). Auch als der Beginn des Englischunterrichts in die Klassenstufe 1 vorverlegt wurde (MSB NRW, 2009), geschah dies im Zuge einer Erhöhung des gesamten Stundenvolumens und ohne Abzüge im Fach Deutsch. In der aktuellen Fassung wurde der Unterrichtsbeginn wieder in Klassenstufe 3 verlegt (MSB NRW, 2021), allerdings mit wöchentlich drei Stunden Englischunterricht verbunden mit einer Erhöhung des gesamten Stundenvolumens (das Gesamtvolumen für Klasse 1 und 2 blieb übrigens unverändert und die nun freien Stunden wurden den Basisfächern zugewiesen). Zumindest für Nordrhein-Westfalen ist die Aussage zur Kürzung auf Kosten des Deutschunterrichts also nicht zutreffend.

Empirische Erkenntnisse zum frühen Fremdsprachenunterricht

Welche Erkenntnisse empirischer Forschung liegen zu den kritisierten Aspekten vor? Wie schon im ersten Teil zu diesem Beitrag möchte ich auch hier zuvor anmerken, dass ich kein Experte für Fremdsprachendidaktik oder Elementarpädagogik bin. Nichtsdestotrotz werden wir die genannten Prämissen und Argumentationen vor dem Hintergrund empirischer Forschungen betrachten. Dabei wird der Fokus auf das Fach Englisch gelegt, da sich die meisten vorliegenden Untersuchungen auf dieses Fach beziehen. Es existieren aber auch Untersuchungen zu anderen Fremdsprachen in der Grundschule (z.B. Peyer et al., 2016; Jung, 2015; Schlemminger, 2011). Modellversuche zum Englischunterricht in der Grundschule wurden in Deutschland schon seit den 60er-Jahren des vorherigen Jahrhunderts durchgeführt (z.B. Doyé & Lüttge, 1977; Kraifl, 1972; vgl. Gompf, 1986) und auch im Zuge der flächendeckenden Einführung deutschlandweit wurden eine Vielzahl von Untersuchungen durchgeführt (vgl. Hempel et al., 2017), teilweise mit dem expliziten Ziel einer Evaluation des frühen Fremdsprachenunterrichts in der Grundschule (z.B. Groot-Wilken & Husfeldt, 2013). In Anlehnung an die Darstellung von Baumert et al. (2020) lassen sich diese Untersuchungen grob danach unterscheiden, ob sie eher die Sprachkompetenzen von Kindern am Ende der Grundschulzeit oder eher die Sprachkompetenzen von Schüler*innen in der Sekundarstufe I (oder sogar Studierenden) untersuchen. Natürlich bestehen zwischen den Untersuchungen Unterschiede, beispielsweise im Studiendesign (z.B. Anzahl der Messzeitpunkte, Stichproben) oder darin, welche Facetten fremdsprachlicher Kompetenzen in den Fokus genommen wurden (z.B. Hörverstehen, Leseverstehen, mündliche Sprachkompetenz, Wortschatz etc.).

Wie gut können“ Schüler*innen am Ende der Grundschule Englisch?

Es liegen mehrere Untersuchungen vor, die längsschnittlich untersucht haben, wie sich die Kompetenzen von Schüler*innen im Fach Englisch im Verlauf der Grundschule verändern bzw. querschnittlich erhoben haben, welche Kompetenzniveaus von Kindern am Ende der Grundschulzeit erreicht werden (vgl. Summer & Böttger, 2022). Bei den meisten Untersuchungen hatte der Englischunterricht dabei einen Umfang von zwei Unterrichtsstunden pro Woche für zwei bzw. drei Schuljahre. So wurden im Projekt EVENING (Evaluation Englisch in der Grundschule) in den Jahren 2006 bis 2007 mit Schüler*innen aus zwei Kohorten aus Nordrhein-Westfalen (N = 1748 und N = 1344) standardisierte Sprachstandstests durchgeführt (Hör- und Leseverstehenstests, mit einer Teilstichprobe auch Sprechfertigkeitstests) (vgl. Groot-Wilken & Husfeldt, 2013). Im Bereich Hörverstehen befanden sich dabei 73% der Schüler*innen in den oberen zwei Quartilen der maximal erreichbaren Punktzahl, im Bereich Leseverstehen befanden sich 74,2% in den oberen zwei Quartilen (Paulick & Groot-Wilken, 2009). „Die festgestellten Leistungen […] liegen für den weitaus überwiegenden Anteil der Schülerschaft auf bzw. oberhalb der fachlichen Anforderungsniveaus, das der zum Testzeitpunkt geltende Lehrplan vorgibt“ (Paulick & Groot-Wilken, 2009, 194f.). Ebenfalls zeigte sich, „[…] dass viele Sprecher über […] eine basale produktive Fertigkeit des Sprechens in der Fremdsprache am Ende des 4. Schuljahres verfügen“ (Keßler, 2009, 175). Ähnliche Ergebnisse bzgl. des Hörverstehens wurden auch im Rahmen der KESS-Studie (Kompetenzen und Einstellungen von Schülerinnen und Schülern) im Bundesland Hamburg berichtet (May, 2006). In der BIG-Studie (BIG-Kreis, 2015) wurden verschiedene sprachliche Kompetenzen von N = 2148 Schüler*innen der Klassenstufe 4 aus 15 Bundesländern untersucht. Dabei ergaben sich ähnliche bzw. etwas positivere Ergebnisse im Vergleich zur EVENING-Studie. Insgesamt lässt sich das erreichte Sprachniveau in diesen Studien im Durchschnitt äquivalent zum Niveau A1 des gemeinsamen europäischen Referenzrahmens für Sprachen (CEFR) (Council of Europe, 2001; 2018) einordnen (vgl. Fleckenstein, 2020). Auch in weiteren Untersuchungen (in Deutschland und in anderen Ländern) zum Englischunterricht in Grund- bzw. Elementarschulen konnte beobachtet werden, dass Grundschüler*innen substanziell sprachliche Kompetenzen aufbauen (z.B. Goorhuis-Brouwer & de Bot, 2010; Heinzmann et al., 2009; vgl. Schwandtke, 2023).

Wann ist der ideale Startzeitpunkt?

Auf Basis der empirischen Untersuchungen zeigt sich, dass Grundschüler*innen im Englischunterricht etwas dazu lernen. Der Unterricht ist also in diesem Sinne wirksam. Offen bleibt dabei allerdings die Frage, wann mit dem Unterricht optimal begonnen werden sollte. In Klasse 1 oder eher in Klasse 3? Oder zu einem anderen Zeitpunkt? Personen, die für einen möglichst frühen Beginn von Fremdsprachenunterricht argumentieren, beziehen sich häufig auf die Hypothese, dass für den Erwerb einer Zweitsprache eine so genannte kritische Periode existiere (vgl. DeKeyser & Larson-Hall, 2005; Lenneberg, 1967). Damit ist ein Zeitfenster in der Entwicklung von Kindern gemeint, in dem diese bestimmte Fähigkeiten im Umgang mit einer zweiten Sprache (Grammatik, Phonologie) besonders gut bzw. einfach erlernen könnten, was später nur mit größerem Lernaufwand möglich sei. Hinweise für die Plausibilität dieser These zeigen Forschungen zu bilingual aufwachsenden Kindern oder zu sogenannten Sprachimmersionsprogrammen (z.B. Böttger & Müller, 2023; Gebauer et al., 2013). Es wird jedoch innerhalb der Spracherwerbsforschung diskutiert, ob dieser Ansatz überhaupt auf den Unterricht in der Grundschule mit einer relativ geringen Zahl an Lerngelegenheiten übertragen werden kann (vgl. Sopata, 2018; Larson-Hall, 2008). Abgesehen von dieser Hypothese wird aber grundsätzlich erwartet, dass ein früherer Beginn generell mit mehr Lerngelegenheiten für das Englischlernen einhergeht.

In Zusammenfassungen internationaler empirischer Studien zeigt sich meist, dass ältere Kinder (über 10 Jahre) einen etwas schnelleren Zuwachs in sprachlichen Kompetenzen aufweisen als jüngere Kinder (5 bis 8 Jahre) und sich eine Art Aufholeffekt der später startenden Schüler*innen ergibt (Huang, 2016). Eventuell sind es derartige Untersuchungen, auf die sich Heinz-Peter Meidinger im oben genannten Zitat bezieht. Das ist allerdings nur eine Vermutung meinerseits. Allerdings besteht in Bezug auf derartige Studien immer eine Schwierigkeit darin, dass für einen sinnvollen Vergleich zwischen den beiden Gruppen auch die Anzahl an Lerngelegenheiten vergleichbar sein muss. Studien mit einer besseren Kontrolle der Bedingungen (wie die Anzahl an Lerngelegenheiten) lassen z.B. vermuten, dass ein früherer Start sich auf verschiedene Aspekte sprachlicher Kompetenz unterschiedlich auswirkt (vgl. Muñoz, 2006). Für den Kontext des Englischunterrichts in der Grundschule in Nordrhein-Westfalen berichten Wilden et al. (2013) auf Basis einer Analyse von Sprachtest von ca. N = 6500 Schüler*innen einen kleinen statistisch signifikanten Vorteil für Schüler*innen, deren Englischunterricht schon in der ersten Klasse begonnen hat, im Vergleich zu Schüler*innen, die in der dritten Klasse begonnen haben (Effektstärken: Hörverstehen d = 0.21, Leseverstehen d = 0.17). Aber auch hier waren in beiden Gruppen jeweils unterschiedlich viele Lerngelegenheiten verfügbar. Insgesamt sind die Ergebnisse empirischer Untersuchungen zur Frage nach dem Effekt des frühen Beginns des Englischlernens auf den Kompetenzerwerb in der Grundschule nicht eindeutig.

Was bringt früher Fremdsprachenunterricht langfristig?

Unabhängig davon, ob sie in der ersten oder dritten Klasse begonnen haben, erwerben Schüler*innen im Englischunterricht der Grundschule fremdsprachliche Kompetenzen. Heinz-Peter Meidinger bezieht sich in seiner Kritik allerdings auf die „fremdsprachliche Kompetenz von Schulabsolventen“ (Meidinger, 2021, 57) und damit auf den Zeithorizont der gesamten Schullaufbahn. Zur Frage, wie sich früher Fremdsprachenunterricht in der Grundschule mittelfristig (z.B. in weiterführenden Schulen) oder langfristig (z.B. bei Absolvent*innen) auswirkt, liegen ebenfalls schon einige Untersuchungen vor (vgl. Fleckenstein et al., 2020; vgl. Huang, 2016). Methodisch werden in derartigen Untersuchungen meist bestimmte Aspekte von fremdsprachlichen Kompetenzen in einer größeren Stichprobe von Schüler*innen untersucht (sowohl querschnittlich zu einem Zeitpunkt oder auch die längsschnittliche Entwicklung zu mehreren Zeitpunkten) und anschließend verschiedene Subgruppen von Schüler*innen verglichen, die sich darin unterscheiden, wann diese zum ersten Mal Fremdsprachenunterricht erhalten haben.

Insgesamt sind die Ergebnisse heterogen (Fleckenstein et al., 2020) und es finden sich sowohl Untersuchungen, in denen Lernende mit einem früheren Start in höheren Klassen höhere Kompetenzen aufweisen (z.B. Mihaljevic Djigunovic et al., 2008), als auch Untersuchungen, in denen in höheren Klassen keine Unterschiede zwischen Schüler*innen mit früherem oder späteren Beginn des Fremdsprachenunterrichts gefunden wurden (z.B. Pfenniger & Singleton, 2017). Jaekel et al. (2017) berichteten basierend auf einem Vergleich von N = 5130 Schüler*innen in Nordrhein-Westfalen, dass Schüler*innen mit einem Beginn ab der ersten Klasse in Klasse 5 zwar höhere, in Klasse 7 jedoch schlechtere sprachliche Kompetenzen aufwiesen als Schüler*innen mit einem Beginn ab der dritten Klasse. Die Stichprobe war allerdings besonders selektiert (alle Teilnehmenden stammten aus 31 Gymnasien) und es ist unklar, ob der Umfang an Lerngelegenheiten ausreichend kontrolliert wurde (vgl. Baumert et al., 2020). In einer Replikationsstudie (Jaekel et al., 2022a) wurde zusätzlich eine dritte Kohorte (N = 804 Schüler*innen) betrachtet, die ihre Grundschullaufbahn sechs Jahre später im Vergleich zur ersten Studie begonnen hatten. Dabei ergab sich für Klasse 5 ein analoges Ergebnis, für Klasse 7 ein Aufholeffekt für die später startenden Schüler*innen und in Klasse 9 wieder ein Vorteil für früh startende Schüler*innen (Jaekel et al., 2022b). Insgesamt ist die Zusammenfassung der Ergebnisse einzelner Untersuchungen aber schwierig, da sie sich in Untersuchungsdesign, verwendeten Instrumenten und insbesondere den betrachteten Stichproben stark unterscheiden. Im Kern besteht dabei immer die Frage, ob die verglichenen Schüler*innengruppen über vergleichbare Eingangsvoraussetzungen verfügen (siehe hierzu auch unseren Beitrag zur Todsünde Nr. 2). Für den Englischunterricht in Deutschland überwiegen dabei bisher Untersuchungen, die keinen Vorteil eines früher beginnenden Englischunterrichts zeigen. Ist also ein früher Beginn des Englischunterrichts nicht sinnvoll?

Gelingt der Übergang in die weiterführende Schule?

Für eine Interpretation dieser Ergebnisse sollte die für die meisten Untersuchungen geltende Anmerkung von Fleckenstein et al. (2020) beachtet werden: „Keine der Untersuchungen prüfte aber die Anschlussfähigkeit des Sekundarschulunterrichts an die in der Grundschulzeit erworbenen Kenntnisse – eine Voraussetzung, die erfüllt sein muss, bevor Rückschlüsse auf mangelhafte Qualifikationsleistungen der Grundschule gezogen werden können“ (Fleckenstein et al., 2020, 143). Um diese Schwierigkeit in empirischen Analysen berücksichtigen zu können, nutzten Baumert et al. (2020) die Daten der nationalen Überprüfung des Erreichens von Bildungsstandards (BISTA) des IQB für Schüler*innen der Klasse 9. Genauer betrachteten sie die Kohorte des Schuljahres 2008/2009, in dem noch nicht für alle befragten Schüler*innen früher Englischunterricht in der Grundschule stattgefunden hat. Es handelt sich um eine stratifiziert gezogene, repräsentative Stichprobe. Um eine höhere Vergleichbarkeit herzustellen, wurden Schüler*innen mit bestimmten Merkmalen ausgeschlossen (z.B. zu Hause wird Englisch gesprochen, Teilnahme an bilingualen Schulprogrammen). Die für die Analysen genutzte Stichprobe besteht aus N = 19.653 Schüler*innen aus allen Bundesländern. Dabei wurden die fremdsprachlichen Kompetenzen (Lesen, Hörverstehen) von drei Gruppen verglichen: Frühstarter*innen (Beginn Klasse 1 oder 2), Mittelstarter*innen (Beginn Klasse 3 bis 4) und Spätstarter*innen (Beginn Klasse 5). Zudem wurden umfangreiche Einflussvariablen kontrolliert (z.B. die sprachlichen Kompetenzen im Deutschen). Es ergab sich kein signifikanter Unterschied im Ausmaß der fremdsprachlichen Kompetenz zwischen den drei Gruppen, wobei allerdings ein starker Einfluss der Schulform deutlich wird. So wird bezogen auf den Übergang von Grundschule in die weiterführende Schule berichtet: „The finding that none of the specified interactions between AO [age of onset] and school type were significant […] is a strong indicator that secondary-level English instruction failed to respond adaptively to students’ different proficiency levels at entry to the school. These problems seem to be most pronounced in Gymnasium schools […]“ (Baumert et al., 2020, 1092).

Auf Basis dieser Analysen lässt sich begründet vermuten, woran es liegt, dass im Schulsystem (bisher) kein langfristig positiver Effekt eines früheren Fremdsprachenunterrichts beobachtet wurde. Der Unterricht an weiterführenden Schulen wird eventuell nicht ausreichend an die (für viele erfahrenere Lehrkräfte nun auch neuen) Lernvoraussetzungen von Schüler*innen angepasst. Dies ist konsistent zur Formulierung von Heinz-Peter Meidinger, dass viele Lehrkräfte am Gymnasium „nochmals von vorne an[fangen]“ (Meidinger, 2021, 58) und quasi einen einheitlichen Unterricht für alle Klassen unabhängig von den tatsächlichen Voraussetzungen der Schüler*innen anbieten (vgl. Böttger, 2009). Die Untersuchung von Jaekel et al. (2022c) deutet zudem darauf hin, dass insbesondere Schüler*innen mit schwächeren fremdsprachlichen Kompetenzen den Übergang in die weiterführende Schule eher als „Bruch“ im Englischunterricht empfinden. Welchen Schluss man daraus nun zieht ist eine Frage der (normativen) Perspektive. Man könnte sagen, dass Englischunterricht in der Grundschule grundsätzlich nicht mehr erteilt werden sollte (vgl. Votja, 2023), um unterschiedliche Lernvoraussetzungen beim Eintritt in Klasse 5 zu vermeiden. Oder man könnte sagen, dass der Unterricht in Klasse 5 stärker an die individuellen Voraussetzungen der Schüler*innen angepasst werden sollte.

Fazit

Ob zur Beurteilung der Wirksamkeit des frühen Fremdsprachenunterrichts die gesamte Schullaufbahn von Schüler*innen (die je nach weiterführender Schulform zwischen neun und dreizehn Jahren liegen kann) den geeigneten Zeitmaßstab bildet, ist ebenfalls eher eine normative und keine rein empirische Frage. Die Frage, wann der optimale Beginn für den Unterricht ist, wird für andere Fächer der Grundschule auch selten diskutiert. Ist es besser mit Mathematik schon in Klasse 1 zu beginnen und nicht erst ab Klasse 3? Diese Frage wirkt auf den ersten Blick etwas unsinnig, was auch daran liegt, dass die Existenz eines Faches in der Grundschule nicht allein aufgrund empirischer Erkenntnisse zur Effizienz des Lernens in diesem Fach oder aufgrund von Erfordernissen für Unterricht in den weiterführenden Schule legitimiert wird, sondern aus bildungstheoretischen Gründen. Mathematik wird auch aus dem Grund schon früh unterrichtet, weil mathematische Kenntnisse als wichtiges Element der Lebenswelt und Grundlage zu gleichberechtigter Teilhabe für Kinder an der Gesellschaft betrachtet werden. Man kann argumentieren, dass dies in einer stärker globalisierten Welt auch für das Erlernen basaler sprachlicher Kompetenzen im Englischen gilt (vgl. KMK, 2013). Auch der überwiegende Teil von Eltern sieht in repräsentativen Umfragen aktuell Englisch als sehr wichtiges Schulfach (Körber-Stiftung, 2023).

Generell gilt aber für alle Veränderungen im Schulsystem, dass die reine Einführung an einer spezifischen Stelle meist nicht ausreicht, um langfristige Effekte zu erzielen. Veränderungen in der Grundschule sollten bzw. müssen immer auch in weiterführenden Schulen zu Anpassungen führen und dafür wäre es sinnvoll, wenn es bundesweit einheitliche Bildungsstandards für den frühen fremdsprachlichen Unterricht gäbe. Hier möchte ich Heinz-Peter Meidinger also explizit zustimmen, wobei die länderspezifischen Curricula durchaus auch jetzt schon Orientierungspunkte für Lehrkräfte an weiterführenden Schulen bieten (für Nordrhein-Westfalen siehe z.B. hier). Und natürlich kommt es auch darauf an, dass Unterricht, wenn er denn stattfindet, mit einer ausreichenden Qualität erteilt wird. Daher ist es auch notwendig, dass es ausreichend gut ausgebildete Englischlehrkräfte für die Grundschule gibt. Und an dieser Stelle steht auch empirisch fest, dass der Bedarf noch nicht ausreichend gedeckt wird (z.B. Ziegler et al., 2019; vgl. Bartosch et al., 2020).

Das dritte Beispiel für die so genannte Todsünde Nr. 3, die Einführung von Bachelor- und Masterstudiengängen in Deutschland, ist Gegenstand des dritten Teils dieses Beitrags sein. Er findet sich hier.

Literatur:

  • Bartosch, R., Frisch, S., Kötter, M., & Reckermann, J. (2020). Stellungnahme von Vertreter*innen der Fremdsprachenforschung zur Rückverlegung des Englischunterrichts in Klasse 3 in NRW zum Schuljahr 2021/2022. (Online)
  • Baumert, J., Fleckenstein, J., Leucht, M., Köller, O., & Möller, J. (2020). The long‐term proficiency of early, middle, and late starters learning English as a foreign language at school: A narrative review and empirical study. Language Learning, 70(4), 1091-1135. (Online)
  • BIG-Kreis (Hrsg.) (2015). Der Lernstand im Englischunterricht am Ende von Klasse 4. Ergebnisse der BIG-Studie. Domino-Verlag. (Online)
  • Böttger, H. (2009). Englischunterricht in der 5. Klasse an Realschulen und Gymnasien: eine qualitative Studie zur Behandlung der Ergebnisse des Englischunterrichts in der Grundschule im bayerischen Schulsystem. Lehrstuhl für Schulpädagogik, FAU Nürnberg.
  • Böttger, H., & Müller, T. (2023). Learning in Two Languages: A Long-Term Study at Bavarian Bilingual Elementary Schools. In J.L. Estrada Chichón, & F. Zayas Martínez (Eds.), Handbook of Research on Training Teachers for Bilingual Education in Primary Schools (pp. 208-236). IGI Global. (Online)
  • Council of Europe (2001). Common European framework of reference for languages: Learning, teaching, assessment. Council of Europe. (Online)
  • Council of Europe (2018). Common European framework of reference for languages: Learning, teaching, assessment. Companion volume with new descriptors. Council of Europe. (Online)
  • DeKeyser, R. M., & Larson-Hall, J. (2005). What does the critical period really mean? In J. F. Kroll, & A. M. B. Groot (Eds.), Handbook of bilingualism: Psycholinguistic approaches (pp. 88 – 108). Oxford University Press.
  • Doyé, P., & Lüttge, D. (1977). Untersuchungen zum Englischunterricht in der Grundschule. Bericht über das Braunschweiger Forschungsprojekt ‚Frühbeginn des Englischunterrichts‘. Westermann.
  • Fleckenstein, J., Möller, J., & Baumert, J. (2020). Ist jünger immer besser? Frühes Fremdsprachenlernen in der Grundschule. Zeitschrift für Pädagogische Psychologie, 34(3-4), 133-148. (Online)
  • Gebauer, S. K., Zaunbauer, A. C. M. & Möller, J. (2013). Cross-Language Transfer in English Immersion Programs in Germany: Reading Comprehension and Reading Fluency. Contemporary Educational Psychology, 38, 64-74. (Online)
  • Gompf, G. (1986). The Early Start of English—Recent trends and new directions in the Federal Republic of Germany. International Review of Education, 32, 3-22. (Online)
  • Goorhuis-Brouwer, S., & de Bot, K. (2010). Impact of early English language teaching on L1 and L2 development in children in Dutch schools. International Journal of Bilingualism, 14(3), 289-302. (Online)
  • Groot-Wilken, B., & Husfeldt, V. (2013). Die Testinstrumente und -verfahren des EVENING-Projekts: Eine empirische Betrachtungsweise. In O. Börner, G. Engel, & B. Groot-Wilken (Hrsg.), Hörverstehen, Leseverstehen, Sprechen (S. 121–140). Waxmann. (Online)
  • Heinzmann, S., Müller, M., Oliveira, M., Haenni Hoti, A., & Wicki, W. (2009). Englisch und Französisch auf der Primarstufe: Verlängerung des NFP-56-Projekts: Schlussbericht. Pädagogische Hochschule Zentralschweiz. (Online)
  • Hempel, M., Kötter, M., & Rymarczyk, J. (2017). Fremdsprachenunterricht in der Grundschule in den Bundesländern Deutschlands: Eine Bestandsaufnahme des Status quo und seiner gewünschten Weiterentwicklung. Peter Lang International Academic Publishers. (Online)
  • Hopp, H., Vogelbacher, M., Kieseier, T., & Thoma, D. (2019). Bilingual advantages in early foreign language learning: effects of the minority and the majority language. Learning and Instruction, 61, 99-110. (Online)
  • Huang, B. H. (2016). A synthesis of empirical research on the linguistic outcomes of early foreign language instruction. International Journal of Multilingualism, 13, 257-273. (Online)
  • Jaekel, N., Schurig, M., Florian, M., & Ritter, M. (2017). From early starters to late finishers? A longitudinal study of early foreign language learning in school. Language Learning, 67, 631–664. (Online)
  • Jaekel, N., Schurig, M., & Ritter, M. (2022a). Investigating cohort effects of early foreign language learning. The Language Learning Journal, 1-13. (Online)
  • Jaekel, N., Schurig, M., van Ackern, I., & Ritter, M. (2022b). The impact of early foreign language learning on language proficiency development from middle to high school. System106, 102763. (Online)
  • Jaekel, N., van Ackern, I., Schurig, M., & Markus, R. (2022c). Investigating the transition from elementary to secondary school: student perspectives of the continuum and receptive language proficiency. The Language Learning Journal, 50(6), 747-762. (Online)
  • Jung, B. (2015). Fremdsprachenunterricht am Übergang von der Primar-zur Sekundarstufe: eine Pilotstudie zum saarländischen Französischunterricht. Universität Koblenz-Landau. (Online)
  • Kaifel, F. (1972). Englisch in der Grundschule: ein Vergleich von Schulversuchen in Berlin, Kiel, Bochum, Tübingen und Kassel. Pädagogische Hochschule Weingarten.
  • Keßler, J. (2009). Zum mündlichen englischen Sprachgebrauch von Grundschulkindern in Nordrhein-Westfalen am Ende des 4. Schuljahres. In G. Engel, Groot-Wilken, & E. Thürmann (Hrsg.), Englisch in der Primarstufe – Chancen und Herausforderungen. Evaluation und Erfahrungen aus der Praxis (S. 158-178). Cornelsen.
  • KMK (2013). „Fremdsprachen in der Grundschule – Sachstand und Konzeptionen 2013“ – Beschluss der Kultusministerkonferenz vom 17.10.2013. (Online)
  • Körber-Stiftung (Hrsg.) (2023). Eltern im Fokus 2023. Wie Eltern auf Bildung und die berufliche Zukunft ihrer Kinder blicken. Körber-Stiftung. (Online)
  • Larson-Hall, J. (2008). Weighing the benefits of studying a foreign language at a younger starting age in a minimal input situation. Second Language Research, 24, 35-63. (Online)
  • Lenneberg, E. (1967). Biological foundations of language. Wiley.
  • May, P. (2006), Englisch-Hörverstehen am Ende der Grundschulzeit. In W. Bos, & M. Pietsch (Hrsg.), KESS 4 – Kompetenzen und Einstellungen von Schülerinnen und Schülern am Ende der Jahrgangsstufe 4 in Hamburger Grundschulen (S. 223-224). Waxmann.
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Mihaljevic Djigunovic, J., Nikolov, M., & Otto, I. (2008). A comparative study of Croatian and Hungarian EFL students. Language Teaching Research, 12, 433–452. (Online)
  • MSB NRW (Ministerium für Schule und Bildung des Landes Nordrhein-Westfalen) (1996). Anlage zur Verordnung über den Bildungsgang in der Grundschule (Ausbildungsordnung gemäß § 26 b SchVG – AO-GS). (Online)
  • MSB NRW (Ministerium für Schule und Bildung des Landes Nordrhein-Westfalen) (2003). Verordnung über den Bildungsgang in der Grundschule (Ausbildungsordnung
    gemäß § 26 b SchVG – AO-GS) in der Fassung der Bekanntmachung vom 14. November 1996
    , geändert durch VO v. 31. 1. 2003; in Kraft getreten am 1. August 2003. (Online)
  • MSB NRW (2005). Anlage zur Verordnung über den Bildungsgang in der Grundschule (Ausbildungsordnung Grundschule – AO-GS). (Online)
  • MSB NRW (2009). Anlage zur Verordnung über den Bildungsgang in der Grundschule (Ausbildungsordnung Grundschule – AO-GS). (Online)
  • MSB NRW (2021). Anlage zur Verordnung über den Bildungsgang in der Grundschule (Ausbildungsordnung Grundschule – AO-GS). (Online)
  • Muñoz, C. (2006). The effects of age on foreign language learning: The BAF Project. In C. Muñoz (Ed.), Age and the rate of foreign language learning (pp. 1–40). Multilingual Matters.
  • Paulick, C., & Groot-Wilken, B. (2009). Rezeptive Fähigkeiten und Fertigkeiten am Ende der 4. Klasse unter besonderer Berücksichtigung der sprachlichen Schülerbiografien. In G. Engel, Groot-Wilken, & E. Thürmann (Hrsg.), Englisch in der Primarstufe – Chancen und Herausforderungen. Evaluation und Erfahrungen aus der Praxis (S. 179-196). Cornelsen.
  • Peyer, E., Andexlinger, M., Kofler, K., & Lenz, P. (2016). Projekt Fremdsprachenevaluation BKZ: Schlussbericht zu den Sprachkompetenztests. Pädagogische Hochschule Freiburg, CH. (Online)
  • Pfenninger, S. E., & Singleton, D. (2017). Beyond age effects in instructional L2 learning: Revisiting the age factor. Multilingual Matters. (Online)
  • Schlemminger, G. (2011). Sprachprofilanalyse: methodologische Überlegungen und erste Ergebnisse einer Longitudinalstudie zur Sprachentwicklung einer Schülerin in einer bilingualen Grundschulklasse Französisch. Zeitschrift für interkulturellen Fremdsprachenunterricht, 16(2), 93-115. (Online)
  • Schwandtke, K. (2023). Die Grammatik-und Wortschatzkenntnisse von Englischlernenden am Ende der Jahrgangsstufe 4: Eine sprachdidaktische Auswertung dialogischer Sprachdaten. In H. Böttger, & N. Schlüter (Hrsg.), Fortschritte im frühen Fremdsprachenlernen – Band zur 5. Konferenz (S. 204-216). FLOH Stiftung LERNEN. (Online)
  • Sopata, A. (2018). Der frühe Fremdsprachenunterricht–je früher desto besser?. Glottodidactica. An International Journal of Applied Linguistics36(1), 95-105. (Online)
  • Summer, T., & Böttger, H. (Eds.). (2022). English in Primary Education: Concepts, Research, Practice. University of Bamberg Press. (Online)
  • Votja, S. (2023, 9. Juni). Lehrerpräsident gegen Englischunterricht an allen Grundschulen. Zeit Online, https://www.zeit.de/gesellschaft/schule/2023-06/deutscher-lehrerverband-heinz-peter-meidinger-englischunterricht
  • Wilden, E., Porsch, R., & Ritter, M. (2013). Je früher desto besser?–Frühbeginnender Englischunterricht ab Klasse 1 oder 3 und seine Auswirkungen auf das Hör-und Leseverstehen. Zeitschrift für Fremdsprachenforschung, 24(2), 171-201. (Online)
  • Ziegler, C., Richter, D., & Hartung-Beck, V. (2019). Entwicklung des Anteils fachfremden Unterrichts an Berliner Schulen. Eine Untersuchung zur Identifizierung verschiedener Verlaufsmuster. In D. Fickermann, & H. Weißhaupt (Hrsg.), Bildungsforschung mit Daten der amtlichen Statistik (S. 121-139). Waxmann. (Online)

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 4/12 – Teil 1

Todsünde Nr. 3: Zu viele unausgereifte Reformen im Bildungssystem

In einer Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei betrachten wir, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Grundsätzlich ist daher hilfreich, das entsprechende Buchkapitel gelesen zu haben, was ich an dieser Stelle ausdrücklich empfehlen möchte. Thesen aus dem Buch werden im Konjunktiv als indirekte Rede wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll. Der vorherige, zweiteilige Beitrag zu dieser Reihe findet sich hier. An dieser Stelle kann ich auch schon einmal ankündigen, dass auch dieser Beitrag wieder aus zwei Teilen besteht.

Zum Abschied

Bevor wir in diesem Beitrag aber die dritte der vom Autor so bezeichneten zehn Todsünden der Schulpolitik betrachten, möchte ich die Gelegenheit nutzen, Heinz-Peter Meidinger, nachdem er nicht noch einmal zur Wiederwahl als Präsident des Deutschen Lehrerverbandes angetreten ist, einen etwas ruhigeren Ruhestand bzw. eine hoffentlich entspanntere Zeit zu wünschen. Er bleibt dem Verband als Ehrenpräsident erhalten und ich vermute, dass er sich auch in Zukunft immer mal wieder zu verschiedenen Bildungsthemen öffentlich äußern wird, so wie er das ja auch in seinem Buch schon getan hat. Und auch wir werden diese Blogreihe natürlich fortsetzen.

Nichts funktioniert, nichts wird geprüft

Zusammengefasst äußert Heinz-Peter Meidinger im Kapitel zur dritten Todsünde der Schulpolitik in gewohnt zugespitzter Sprache die Kritik, dass durch Bildungspolitker*innen in Schulen bzw. im Schulsystem in zu kurzer zeitlicher Abfolge zu viele Veränderungen vorgenommen werden, „welche Schulen und Lehrkräften eine kontinuierliche Bildungs- und Erziehungsarbeit unmöglich“ (Meidinger, 2021, 51) mache. Dabei gäbe es kaum erfolgreiche Bildungsreformen, die auch wirklich zu einer Verbesserung geführt hätten. Demgegenüber stünde eine Vielzahl von schlechten Veränderungen und Heinz-Peter Meidinger führt aus: „[…] ja eigentlich ist die bildungsdeutsche Bildungspolitik der Nachkriegsgeschichte nichts anderes als eine Aneinanderreihung mehrheitlich gescheiterter Reformen […]“ (Meidinger, 2021, 52).

Als Gemeinsamkeit gescheiterter Reformen benennt Heinz-Peter Meidinger, dass diese „in aller Regel weitgehend ohne vorherige Erprobung, ohne Modellversuche und Evaluationsphasen sowie ohne Beteiligung von kompetenten Schulpraktikern“ (Meidinger, 2021, 52f.) umgesetzt würden. Unabhängig davon, ob das für spezifische Veränderungen zutrifft oder nicht, würde ich selbstverständlich ebenfalls dafür plädieren, dass Interventionen in der Schule bzw. generell in der Bildung natürlich empirisch auf ihre Wirkung analysiert werden sollten, wie es ja auch in anderen gesellschaftlich relevanten Feldern getan wird (z.B. in der Medizin). Eine solche stärkere Orientierung an wissenschaftlicher Evidenz wird auch erwartungsgemäß mehr oder weniger explizit durch viele Bildungswissenschaftler*innen gefordert, wobei im Detail natürlich diskutiert werden muss, welche Art Evidenz gemeint ist und inwiefern vorliegende Evidenz auch konstruktiv in Bildungspraxis einfließen kann bzw. sollte (vgl. Bauer & Koller, 2023; Besa et al., 2023).

Heinz-Peter Meidinger nennt eine Reihe von Beispielen für aus seiner Sicht gescheiterte Bildungsreformen, die ohne ausreichende ergebnisoffene, wissenschaftliche Evaluationen umgesetzt worden seien, z.B. die Umstellung der neunjährigen Schulzeit am Gymnasium auf acht Jahre (siehe hierzu auch den ersten Beitrag unserer Blogreihe), die Einführung der Mengenlehre in der Grundschule in den 70er-Jahren des letzten Jahrhunderts (vgl. Hamann, 2018) oder die Rechtschreibreform (ich vermute, es ist die von 1996 gemeint, das geht aus dem Text leider nicht eindeutig hervor). Während diese Veränderungen eher kurz angerissen werden, werden drei Beispiele im Kapitel etwas ausführlicher erläutert bzw. argumentiert, warum diese negativ oder schädlich gewesen seien: der methodisch-didaktische Lehransatz „Lesen durch Schreiben“, der Fremdsprachenunterricht in der Grundschule sowie die Einführung von Bachelor- und Masterstudiengängen im Zuge der sogenannten Bolognareform. Diese drei werden im Folgenden daher auch vor dem Hintergrund von Ergebnissen der empirischen Bildungsforschung etwas genauer betrachtet.

„Schreiben nach Gehör“ in der Grundschule

Zum ersten dieser drei Beispiele möchte ich vorweg darauf hinweisen, dass ich selbst kein Sprachdidaktiker oder Elementarpädagoge bin. Es ist natürlich dennoch möglich, einen kurzen Überblick über den empirisch-fachdidaktischen Forschungsstand zu geben, auch wenn ich selbst keine vertieften Kenntnisse über die fachdidaktischen Feinheiten von Lehr-Lern-Konzeptionen in dem Feld habe. Mit dem, was in Medienberichten häufig als „Schreiben nach Gehör“ bezeichnet wird, ist meist das methodisch-didaktische Konzept „Lesen durch Schreiben“ gemeint, das in seiner ursprünglichsten Form von dem Schweizer Lehrer Jürgen Reichen konzipiert wurde (Reichen, 1988). Heinz-Peter Meidinger beschreibt die Methode zusammenfassend so, dass „sich Kinder das Schreiben am besten und am leichtesten selbst beibringen könnten“ oder als Methode „[…] mit der von Schülern zunächst alles so geschrieben wird, wie es klingt […]“) (jew. Meidinger, 2021, 54). Diese Beschreibung gibt das Konzept und die damit verbundenen Ziele natürlich nicht vollständig wieder (wobei man berücksichtigen muss, dass das gesamte Kapitel neun Seiten umfasst, auf denen alle drei Beispiele angesprochen werden).

Beispiel für eine Anlauttabelle,
Bildnachweis: Wolfram Esser, Wikipedia (Link)

Worum handelt es sich also beim Konzept „Lesen durch Schreiben“? Auch, wenn man es hier natürlich auch nicht vollständig wiedergeben kann, lässt es sich grundsätzlich als umfassendes didaktisches Konzept für den sprachlichen Anfangsunterricht in der Grundschule verstehen, in dem verschiedene Kompetenzen erworben werden sollen (z.B. Lesekompetenz, Schreibkompetenz). Kennzeichnend für das Konzept in der ursprünglichen Form ist, dass im sprachlichen Anfangsunterricht Schüler*innen Angebote für eine möglichst selbstgesteuerte und individualisierte Auseinandersetzung mit sprachlichen Lerngegenständen gemacht werden sollten, was aber auch nach Reichen (1988) Phasen gemeinsamen Unterrichts im Klassenverband nicht ausschließt (vgl. Lorenz, 2017). Praktisch soll dies möglichst in Form des Werkstattunterrichts stattfinden, also in einer vorbereiteten Lernumgebung (mit Materialien etc.), die von den Schüler*innen relativ selbstständig genutzt wird. Reichen (1988) konkretisiert diese Prinzipien eines offenen, selbstgesteuerten Lernens für den Anfangsunterricht im Lesen und Schreiben, wobei er annahm, dass Kinder mit adäquaten Hilfsmitteln grundsätzlich selbst Lesen und Schreiben können. Nach dem Prinzip „Lesen durch Schreiben“ soll zuerst das Schreiben gelernt werden, „damit das Lesen sich dann mit der Zeit individuell als dessen Produkt gewissermaßen von selbst einstellt.“ (Lorenz, 2017, 34). Zentrales Hilfsmittel im Unterricht bildet eine Anlauttabelle, bestehend aus Buchstaben bzw. Buchstabenkombinationen und zugehörigen Bildern. Die Bilder sind so gewählt, dass die Bezeichnungen der Bilder mit dem zugehörigen Buchstaben beginnen und der Anlaut der Bezeichnung der Lautung des Buchstaben entspricht. Mit dieser Tabelle werden die Schüler*innen angeleitet, Wörter zu schreiben, indem Sie sie phonetisch schrittweise in einzelne Laute zerlegen (vgl. Funke, 2014). Ein damit verbundenes Ziel ist es auch, dass die Lernenden mit diesem Hilfsmittel selbst bestimmen können, was sie mit welcher Absicht schreiben möchten, und daher schon früh beginnen, selbst motiviert eigene Schriftprodukte zu erstellen.

Kann „Lesen durch Schreiben“ funktionieren?

Das Konzept wird innerhalb der Sprachdidaktik schon seit den 90er-Jahren des letzten Jahrhunderts aus theoretischen Gründen kontrovers diskutiert (vgl. Funke, 2014). Das betrifft zum einen die Merkmale der deutschen Sprache selbst. Sie ist keine reine Lautschrift, sondern bedeutungstragende Phoneme werden in der Schriftsprache auch durch abstraktere Lautschemata repräsentiert (Brendel et al., 2011). Dabei kann ein Phonem (also der Laut) auch durch unterschiedliche Grapheme (also dem zugehörigen Schriftausdruck) repräsentiert werden (vgl. Hess et al., 2020). Diese Unterschiede können nicht umfassend in einer Anlauttabelle dargestellt werden. Schüler*innen müssen sie sich daher über die Zeit (bewusst) aneignen, um orthografisch korrekt zu schreiben. Zum anderen bezieht sich ein Teil der Kritik auch auf die Empfehlungen Reichens (1988) zur Umsetzung seines Konzepts selbst. Beispielsweise war für ihn eine korrekte Rechtschreibung im Anfangsunterricht nicht zentral und er empfahl, geschriebene Wörter nur dann zu korrigieren, wenn sie gar nicht lesbar seien oder grobe Lautfehler enthalten; dies auch, um Motivation und Schreibfreude aufrecht zu erhalten (vgl. Lorenz, 2017). Die Schulung der korrekten Rechtschreibung sollte dementsprechend auch erst in der zweiten Klasse beginnen. Demgegenüber wird angenommen, dass die Kinder durch das Fehlen des frühen Einübens korrekter Schreibformen kein korrektes schriftsprachliches, inneres Lexikon aufbauen könnten, und dies auch nicht angeregt würde, da im Anfangsunterricht kaum mit fremden Texten gearbeitet würde (z.B. Dürscheid, 2011). Insbesondere werden Schwierigkeiten für schwächere Schüler*innen mit geringerer phonologischer Bewusstheit auch mit nicht-deutscher Muttersprache vermutet (z.B. Valtin, 1998). Da die Schreib- und Lesekompetenz unabhängig voneinander aufgebaut werden (vgl. Bredel et al., 2011), wird zudem kritisiert, dass zuerst Schreiben gelernt und explizites Lesen lernen bewusst vermieden wird.

Grundsätzlich lässt sich die Arbeit mit Anlauttabellen auch durchaus in Modellen zur Beschreibung des Schriftspracherwerbs von Kindern einordnen. Beispielsweise erfolgt der Aufbau von schriftsprachlichen Fähigkeiten im Modell von Frith (1986) in mehreren Stufen, der mit unterschiedlichen Strategien verbunden ist (vgl. Schründer-Lenzen, 2013). In der ersten Stufe (logografische Strategie) orientierten sich Kinder zunächst an der Oberflächenstruktur der Schriftsprache, indem sie Zeichenfolgen auswendig lernen (z.B. den eigenen Namen). In der zweiten Stufe (alphabetische Strategie) verbinden Kinder die gesprochene Sprache mit der geschriebenen Sprache, indem sie zunächst gesprochene Laute mit unterschiedlichen Buchstaben verbinden. An dieser Stelle können Anlauttabellen verortet werden. Zugleich müssen die Lernenden in dieser Stufe lernen, dass das geschriebene Wort nicht rein der Lautsprache folgt (phonemisches Schreiben), was nach Kritiker*innen im Konzept „Lesen durch Schreiben“ nicht ausreichend gelänge bzw. angestrebt werde. In der dritten Stufe (orthografische Strategie) erkennen Schüler*innen zunehmend schriftsprachliche Strukturen (z.B. Ableitungen von Wortstämmen).

Zusammengefasst wird das Konzept bzw. die Umsetzung in Reinform innerhalb der Sprachdidaktik aus rein theoretischer Sicht schon seit Beginn kritisch diskutiert. Der Entwickler und die Nutzer*innen des Konzepts sehen dies erwartungsgemäß anders und gehen davon aus, dass negative Effekte nicht eintreten, die genannten Schwierigkeiten ausreichend berücksichtigt würden und mögliche Nachteile durch andere Vorteile (z.B. bezogen auf die Schreibmotivation) kompensiert würden (vgl. Reichen, 2006). Entscheidend ist aber auch bei didaktischen Lehr-Lern-Konzepten, wie sie nun tatsächlich wirken bzw. inwiefern die angestrebten Lernziele auch empirisch erreicht werden.

Wie kann man das nun überprüfen?

Heinz-Peter Meidinger beschreibt die Auswirkungen des Konzepts „Lesen durch Schreiben“ als äußerst negativ und kritisiert: „30 Jahre lang wurde die Wirksamkeit nie in einer umfassenden Studie überprüft […].“ (Meidinger, 2021, 55). Erst Prof. Dr. Una Röhr-Sendlmeier habe 30 Jahre nach praktischer Einführung des Konzepts eine solche Studie durchgeführt. Vermutlich bezieht sich Heinz-Peter Meidinger hier auf die Ergebnisse der Promotion von Dr. Tobias Kuhl (2020), einem (nun ehemaligen) Doktoranden von Frau Röhr-Sendlmeier. Das lässt sich allerdings nur aus der Beschreibung der Studie durch Heinz-Peter Meidinger schließen, da leider im Kapitel keine Quellenangabe gemacht wird.

Zunächst ist anzumerken, dass auch schon zuvor empirische Untersuchungen zur Wirksamkeit des Konzepts durchgeführt und veröffentlicht wurden (Funke, 2014). Um die Ergebnisse solcher Studien besser interpretieren zu können, ist es hilfreich, typische Schwierigkeiten zu berücksichtigen, die bei empirischen Wirksamkeitsuntersuchungen solch umfassender didaktischer Lehr-Lern-Konzepte auftreten können. Das betrifft zum ersten die Frage, woran man Erfolg oder Misserfolg erkennen kann. „Lesen durch Schreiben“ ist mit verschiedenen Zielen verbunden (z.B. Erwerb von Schreib- und Lesefähigkeit, Erhöhung der Schreibmotivation). Es muss also meist die Veränderung verschiedener Merkmale von Schüler*innengruppen geeignet erfasst werden. Zum zweiten bezieht sich das Konzept „Lesen durch Schreiben“ auf einen relativ langen Zeitraum, der zudem im Konzept selbst nicht genau abgegrenzt wird. Für eine Untersuchung muss daher geklärt werden, welche Gruppen von Schüler*innen wie lange eigentlich betrachtet werden sollen. Geht es bspw. nur um das erste Schuljahr oder muss eigentlich die gesamte Grundschulzeit betrachtet werden? Sollen Schüler*innen an der weiterführenden Schule untersucht werden? Je länger eine Untersuchung dauert, desto schwieriger ist sie natürlich praktisch durchführbar. Das ist insbesondere deshalb bedeutsam, da man zur Beurteilung der Wirksamkeit natürlich genügend Schüler*innen braucht, damit bei der erwartbaren Streuung überhaupt Durchschnittsunterschiede zwischen Gruppen festgestellt werden können. Zum dritten geht es auch häufig um die Frage, im Vergleich zu was eine Lehr-Lern-Konzeption wirksam ist. Beispielsweise werden Schüler*innen mit Hilfe des Konzepts „Lesen durch Schreiben“ wahrscheinlich mehr Schreib- und Lesefähigkeiten lernen, als wenn sie gar keinen Unterricht erhielten. Daher geht es auch meist um die Frage, ob der Ansatz wirksamer ist im Vergleich zu anderen möglichen Konzepten. Als Vergleichskonzept zu „Lesen durch Schreiben“ dient häufig Unterricht, in denen so genannte Fibeln eingesetzt werden (z.B. die Piri-Fibeln des Klettverlags, explizit nur als Beispiel erwähnt – nicht als Werbung oder Empfehlung). Dabei handelt es sich um Lehrtexte bzw. Unterrichtsmaterialien, die im Sinne eines Lehrgangs sachlogisch, kleinschrittig strukturiert sind und bei dem sich im zugehörigen Unterricht – zugespitzt formuliert – alle Kinder zu gleichen Zeiten mit den gleichen Materialien beschäftigen. Zum vierten besteht natürlich die Frage, wie genau, umfangreich und auch von den Konzeptentwickler*innen intendiert eine Konzeption auch wirklich im Unterricht durchgeführt wird. Werden z.B. nur einzelne Elemente übernommen oder wird einem Konzept vollständig gefolgt? Werden evtl. sogar verschiedene Konzepte vermischt, was im schulischen Unterricht eher der Regelfall zu sein scheint, insbesondere auch im Anfangsschreibunterricht (vgl. Bremerich-Vos & Wendt, 2019). Davon ist abhängig, ob bestimmte Wirkungen auch wirklich einer Konzeption zugeschrieben werden können oder nicht. Und zum fünften muss bei derartigen Vergleichen sichergestellt werden, dass andere Einflussfaktoren auf das Lernen (z.B. Vorwissen, Erstsprache der Schüler*innen) kontrolliert werden, um abschätzen zu können, welchen Effekt eine Methode bzw. ein Konzept allein hat (diese Schwierigkeiten spielte auch in unserem vorherigen Beitrag zu dieser Reihe eine große Rolle).

Grau ist alle Empirie…

Was liegen denn nun für empirische Ergebnisse zu „Lesen durch Schreiben“ vor? Funke (2014) betrachtet in einer sorgfältigen Metaanalyse die Ergebnisse von 16 Untersuchungen, die in zwischen 1985 und 2010 durchgeführt wurden, sich auf die Klassenstufen 1 bis 4 beziehen, als Vergleichsmaßstab Fibelunterricht nutzen und in denen Ergebnisdaten zu Lese- und/oder Schreibkompetenzen vorliegen. Für die Rechtschreibleistung am Ende von Klasse 1 ergab sich eine kleine Effektstärke von d=0.28 (SD=0.09) zugunsten des „Lesen durch Schreiben“-Konzepts. Grundsätzlich lässt sich aber beobachten, dass die Effekte in den jeweiligen Studien stark schwanken (mal zeigten sich bei „Lesen durch Schreiben“ Vorteile, mal gerade umgekehrt). „Die in den verschiedenen Stichproben gefundenen Effekte weichen so stark voneinander ab, dass man sie nicht als zufällige Varianten einer gemeinsamen Wirkgröße von ein- und derselben Ausprägung auffassen kann.“ (Funke, 2014, 27f.) Für die Klassen 2 bis 4 ergab sich eine homogenere kleine Effektstärke von d=-0.26 (SD=0.05) für die Rechtschreibleistung, also ein Nachteil für „Lesen durch Schreiben“. Generell wurden nur bei wenigen Studien die Voraussetzungen kontrolliert. Werden nur diese Studien einbezogen, ergibt sich kein signifikanter Effekt (d=-0.09. SD=0.15, p=0.57). Bzgl. der Leseleistung am Ende von Klasse 1 ergab sich eine kleine Effektstärke von d=-0.27 (SD=0.14), bezogen auf die Klassen 2-4 d=-0.05 (SD=0.09). Zusammengefasst ergab sich also insgesamt kein konsistentes Bild: Beim Lesen in den Klassen 2-4 keine Unterschiede, beim Schreiben Nachteile mit kleinem Effekt. Die Ergebnisinterpretation ist aber durch verschiedene Faktoren eingeschränkt. Neben der schon erwähnten fehlenden Kontrolle der Eingangsvoraussetzungen wurden unterschiedliche Erhebungsinstrumente genutzt und die Zuordnung der untersuchten Klassen erfolgte über Auskünfte der Lehrkräfte; es ist also nicht ganz klar, wie genau die Methoden auch tatsächlich umgesetzt wurden. „Denkbar ist auch, dass Lesen durch Schreiben-Lehrkräfte ihrem schulischen Umfeld nach keine Zufallsauswahl darstellen.“ (Funke, 2014, 36).

Es liegen seitdem auch aktuellere Analysen vor. Beispielsweise untersuchte Lorenz (2017) auf Basis von repräsentativeren Daten aus der Videostudie im Fach Deutsch des Projekts PERLE, inwiefern Zusammenhänge zwischen dem Einsatz des Konzepts „Lesen durch Schreiben“ und der Rechtschreibleistung von Schüler*innen in Klasse 1 bestehen. Basis sind freie Texte bzw. Briefe , die von N=508 Schüler*innen verfasst und hinsichtlich bestimmter Fehlerarten (z.B. bei der Groß- und Kleinschreibung) analysiert wurden. Die Schüler*innen wurden in vier Gruppen eingeteilt, die sich danach unterscheiden, wie sehr das Konzept „Lesen durch Schreiben“ nach Selbsteinschätzungen der unterrichtenden Lehrkräfte im Unterricht eine Rolle spielte (Stufen: dominant, wichtig, untergeordnet, keine Rolle). In differenzierten Mehrebenenanalysen ergab sich: „Kinder, in deren Deutschunterricht „Lesen durch Schreiben“ eine größere Rolle spielt, schreiben insgesamt einen höheren Anteil ihrer Wörter orthographisch falsch.“ (Lorenz, 2017) Diese Ergebnisse wurden mit einer verbesserten Analyse auch in Hess et al. (2020) berichtet. Auch die Ergebnisse einer Simulationsstudie mit Hilfe neuronaler Netze bestätigen die Nachteile des Konzepts in der Tendenz, wobei allerdings der zurückhaltende Umgang mit Fehlerkorrekturen nach den Empfehlungen von Reichen in den Vordergrund gestellt wurde und nicht die Arbeit mit der Anlauttabelle (Born et al., 2022).

Worauf bezieht sich Heinz-Peter Meidinger?

In der von Heinz-Peter Meidinger erwähnten Untersuchung von Kuhl (2020) wurden mit einem hohen methodisch-organisatorischem Aufwand drei Lehr-Lern-Konzepte für den Sprachanfangsunterricht betrachtet. Neben dem Fibelunterricht und „Lesen durch Schreiben“ auch „Graf Orthos Rechtschreibwerkstatt“, das kurz zusammengefasst einige Ideen von „Lesen durch Schreiben“ übernimmt, umfangreiche Selbstlernmaterialien bereitstellt (insbesondere mit Abschreibübungen), dies mit vielen individualisierten Lernphasen verbindet und in Klasse 1 ebenfalls bewusst wenige Fehlerkorrekturen einsetzt. Neben der Rechtschreibleistung wurden hier auch weitere mögliche Wirkungen der Konzepte (z.B. die Beschäftigung mit Schreiben oder Schrift in der Freizeit) untersucht. Basis bilden Daten von N=3084 Kindern von zwölf Schulen „im Umkreis von 50 km um Bonn“ (Kuhl, 2020, 84), wobei für die Längsschnittstudie zur Rechtschreibleistung Datensätze von N=284 Schüler*innen herangezogen wurden (es wurde auch eine Querschnittsuntersuchung durchgeführt). Insbesondere liegen zu diesen Schüler*innen auch Ergebnisse zu den Eingangsvoraussetzungen in die Grundschule vor (z.B. zur phonologischen Bewusstheit, Familiensprache). Von dieser Gruppe wurde ab Ende des ersten Schuljahres jedes Halbjahr bis zum Ende von Klasse 3 standardisiert die Rechtschreibleistung mit Hilfe der Hamburger Schreib-Probe 1 -10 (May, 2013) erfasst. Die Datenerhebung begann im Jahr 2013 und erstreckte sich dementsprechend über mehrere Schuljahre. Die Zuordnung der Schüler’*innen zu den untersuchten Konzepten erfolgte schulweise auf Basis von Angaben der Lehrkräfte und den in der Schule vorhandenen Materialien. Hierzu führt Kuhl (2020) aus: „Jede Schule hatte sich bereits vor der Akquise zur Studienteilnahme dafür entschieden, den Unterricht nach einem gemeinsamen Leitmedium zu gestalten. Es konnte davon ausgegangen werden, dass der Unterricht in der Realität graduell anders durchgeführt wurde, als er in der Theorie von den Entwicklern der verschiedenen didaktischen Ansätze erdacht worden war. […] Dennoch wurde der Unterricht durch die Entscheidung der Schule für einen spezifischen didaktischen Ansatz als Leitmedium maßgeblich geprägt. Deshalb erschien die Zuordnung des Unterrichts einzelner Schulen zu einer Didaktik als sinnvoll.“ (Kuhl, 2020, 71f.). Es wurde bewusst auf Unterrichtsbeobachtungen verzichtet.

Unterschiede zwischen den drei Gruppen wurden mittels Kovarianzanalysen mit Messwiederholung analysiert, wobei die Eingangsvoraussetzungen als Kovariate berücksichtigt wurden. Dabei ergaben sich große Unterschiede zwischen den drei Konzeptionen (F(2,277)=39.93, p<.001, η²=.247). Die Ergebnisse von Schüler*innen, die nach der Rechtschreibwerkstatt oder „Lesen durch Schreiben“ unterrichtet wurden, unterschieden sich nicht signifikant voneinander. Die Schüler*innen im Fibelunterricht allerdings erzielten mit jeweils großen Effekten bessere Rechtschreibleistungen im Vergleich zu den anderen beiden Konzepten zu allen fünf Messzeitpunkten. Am schwächsten Schnitt insgesamt die Rechtschreibwerkstatt ab. Die Unterschiede zwischen Fibelunterricht und „Lesen durch Schreiben“ verringerten sich im zeitlichen Verlauf etwas. Diese Unterschiede wurden auch in der Querschnittsuntersuchung bestätigt. Bezüglich der anderen untersuchten Variablen zeigten sich im Querschnitt dazu bspw. keine Unterschiede in der Lesemotivation oder der Schreibfreude zwischen den Gruppen. Insgesamt zeigt die Untersuchung also einen Vorteil von Fibelunterricht, für dessen Einsatz sich Kuhl (2020) in der Dissertation auch stark ausspricht, teilweise mit aus meiner Sicht überzogenen negativen Wertungen zu didaktischen Konzepten im Allgemeinen und den Fähigkeiten von Lehrkräften. Insbesondere halte ich es für durchaus sinnvoll, wenn Evaluationen im schulischen Setting auch von Pädagog*innen geplant und durchgeführt werden (vgl. Kuhl, 2020, 143), da auch beim Einsatz von Psycholog*innen und Sozialwissenschaftler*innen ein Priming basierend auf persönlichen Erfahrungen stattfinden kann. Die Forderung nach einer stärkeren Evidenzbasierung von schulischem Handeln und der forschungsbasierten Ausbildung von Lehrkräften teile ich aber ausdrücklich.

Es handelt sich insgesamt um eine aufwändige und sorgfältig durchgeführte Studie mit hoher methodischer Qualität in der Durchführung. Dennoch hat auch diese natürlich einige Limitationen, die die Aussagekraft ihrer Ergebnisse einschränken. Diese liegen insbesondere in der Gelegenheitsstichprobe (was nachvollziehbarerweise mit erhebungsökonomischen Gründen zusammenhängt), der Zuteilung der Schüler*innen zu den einzelnen Konzepten und darin, dass keine genauen Informationen zur Umsetzungstreue der Konzepte vorliegen. Kuhl (2020) argumentiert hierzu: „Es ist anzunehmen, dass sich nicht jeder Lehrer streng an die Vorgaben des Leitmediums gehalten hat und Material, das er als didaktisch sinnvoll erachtet hat, in seine Unterrichtsplanung und -durchführung einfließen ließ. Das Unterrichtsgeschehen unterschied sich demnach graduell zwischen den Klassen – auch innerhalb einer Schule. Dennoch haben sich die Lehrer oder der Rektor für ein Leitmedium entschieden, welches in sämtlichen Klassen einer Schule eingesetzt wurde und den ‚Kurs‘ des Unterrichts maßgeblich bestimmt hat.“ (Kuhl, 2020, 146). Diese Annahme ist nachvollziehbar, aber wird hier natürlich nicht empirisch genauer unterlegt. Es bleibt daher leider unklar, wie Rechtschreibunterricht nach der Anfangsphase in den untersuchten Grundschulen stattgefunden hat. Auch sind die Schüler*innen nicht gleichmäßig über die einzelnen Konzepte verteilt (bspw. im Längsschnitt folgendermaßen: Fibel: N=84 ; Lesen durch Schreiben: N=79, Rechtschreibwerkstatt: N=121), wobei die Unterschiede im Querschnitt noch größer sind. Daneben diskutiert bspw. Brügelmann (2020) auch weitere Aspekte der Studie kritisch, wie z.B. die nicht klare konzeptionelle Unterscheidung der verwendeten Ansätze, eine fehlende Auswertung auf Klassenebene, um den Faktor der Lehrkräfte zu kontrollieren, und, dass die Ergebnisse nicht auf die bundesdeutsche Normierung der Hamburger Schreibprobe bezogen würden: „Nach diesem bundesweit repräsentativen Maßstab entsprechen ‚Lesen durch Schreiben‘-Kinder in Kuhls Studie schon zum Ende des Anfangsunterrichts und über die Grundschulzeit hinweg der bundesdeutschen Norm. Sogar der Anteil besonders leistungsschwacher Schüler*innen ist niedriger als in der Bonner Gesamtstichprobe – besonders auffällig in Klasse 1 und 2. Die ‚Ausreißer‘ bilden die (zusammengefassten) Fibel-Klassen (nach oben) und die Rechtschreibwerkstatt-Klassen (nach unten).“ (Brügelmann, 2020, 3).

Und was heißt das jetzt?

Die vorliegenden Ergebnisse sprechen eher dafür, dass der Ansatz „Lesen durch Schreiben“ keine Vorteile, sondern tendenziell Nachteile gegenüber anderen Schreiblernansätzen im Anfangsunterricht hat. In diesem Sinne würde auch ich eher empfehlen, andere Ansätze im Schreibanfangsunterricht zu wählen, wobei – wie schon erwähnt – ich hierzu kein ausgewiesener Experte bin. Hier stimme ich Heinz-Peter Meidinger explizit zu. Allerdings zeigen die vorliegenden Ergebnisse auch nicht, dass Probleme mit der Rechtschreibleistung am Ende der Grundschule allein auf den Einsatz des Konzepts „Lesen durch Schreiben“ zurückgehen, was er – auch außerhalb seines Buches – anscheinend so interpretiert (z.B. hier). Ob ein Verbot von Methoden, wie im Kapitel zustimmend beschrieben, sinnvoll ist, sei einmal dahingestellt (Was soll denn auch genau verboten werden? Die Nutzung von Anlauttabellen, oder dass Rechtschreibfehler nicht korrigiert werden?). Aus Sicht der empirischen Bildungsforschung sei aber zumindest darauf hingewiesen, dass auch die Wirkungen anderer Lehr-Lern-Konzepte selten empirisch geprüft werden und so gut wie fast alle Konzepte „ohne jegliche empirische Evidenz und Erprobung eingeführt und nie evaluiert […]“ (Meidinger, 2021, 56f.) werden. Insofern könnte man die oben beschriebenen Untersuchungen auch als eine erfolgreiche Evaluation von Fibelunterricht interpretieren. Einführung von Konzepten bedeutet an dieser Stelle, dass entsprechende Materialien zur Nutzung im Unterricht zugelassen werden. Aufgrund der Autonomie von Lehrkräften ist der Einsatz spezifischer Lehr-Lern-Konzepte im Detail derzeit nicht vorschreibbar. Und welche Materialien auch außerhalb geschlossener Lehrwerke oder Konzepte von Lehrkräften tatsächlich eingesetzt werden, ist noch einmal eine ganz andere Frage.

Um diesen schon recht umfangreichen Blogbeitrag nicht zu sehr in die Länge zu ziehen, werden wir die anderen beiden von Heinz-Peter Meidinger genannten Beispiele für seine Todsünde Nr. 3 im zweiten Teil dieses Beitrags betrachten. Er wird an dieser Stelle verlinkt, sobald er online ist.

Literatur:

  • Bauer, J., & Kollar, I. (2023). (Wie) kann die Nutzung bildungswissenschaftlicher Evidenz Lehren und Lernen verbessern? Thesen und Fragen zur Diskussion um evidenzorientiertes Denken und Handeln von Lehrkräften. Unterrichtswissenschaft, 51(1), 123-147. (Online)
  • Besa, K. S., Demski, D., Gesang, J., & Hinzke, J. H. (Hrsg.) (2023). Evidenz-und Forschungsorientierung in Lehrer* innenbildung, Schule, Bildungspolitik und-administration: Neue Befunde zu alten Problemen. Springer Fachmedien Wiesbaden. (Online)
  • Born, J., Nikolov, N. I., Rosenkranz, A., Schabmann, A., & Schmidt, B. M. (2022). A computational investigation of inventive spelling and the “Lesen durch Schreiben” method. Computers and Education: Artificial Intelligence, 3, 100063. (Online)
  • Bredel, U., Fuhrhop, N., & Noack, C. (2011). Wie Kinder lesen und schreiben lernen. Gunter Narr Verlag.
  • Bremerich-Vos, A. & Wendt, H. (2019). Zur Nutzung von Laut- bzw. Anlauttabellen im Deutschunterricht der Grundschule. Zeitschrift für angewandte Linguistik, 70(1), 19–36. (Online)
  • Brügelmann, H. (2020). Einordnung der Ergebnisse der „Bonner Studie “zur Wirkung verschiedener Ansätze des Lese-und Schreibunterrichts auf die Entwicklung der Rechtschreibleistung im Verlauf der Grundschulzeit. (Online)
  • Dürscheid, C. (2011). „Schreib nicht, wie du sprichst.“ Ein Thema für den Deutschunterricht“. In B. Rothstein (Hrsg.), Sprachvergleich in der Schule (S. 89-109). Schneider.
  • Funke, R. (2014). Erstunterricht nach der Methode“ Lesen durch Schreiben“ und Ergebnisse schriftsprachlichen Lernens-Eine metaanalytische Bestandsaufnahme. Didaktik Deutsch: Halbjahresschrift für die Didaktik der deutschen Sprache und Literatur, 19(36), 21-41. (Online)
  • Frith, U. (1986). Psychologische Aspekte des orthografischen Wissens. In G. Augst (Hrsg.), New trends in Graphemics and orthography (S. 218–233). Berlin: de Gruyter.
  • Hamann, T. (2018). Die“ Mengenlehre“ im Anfangsunterricht: historische Darstellung einer gescheiterten Unterrichtsreform in der Bundesrepublik Deutschland (Siegener Beiträge zur Geschichte und Philosophie der Mathematik – Band 9). Universitätsverlag Siegen. (Online)
  • Hess, M., Denn, A. K., Kirschhock, E. M., Lorenz-Krause, A., & Lipowsky, F. (2020). Effekte der Konzeption „Lesen durch Schreiben “auf verschiedene Teilbereiche lauttreuer und orthografischer Verschriftung in der Mitte des ersten Schuljahres. Zeitschrift für Grundschulforschung, 13(2), 317-337. (Online)
  • Kuhl, T. (2020). Rechtschreibung in der Grundschule. Berlin: Springer. (Online)
  • Lorenz, A. (2017). Wer schreibt recht, wer schreibt schlecht?: Eine Untersuchung des Zusammenhangs zwischen der Rechtschreibleistung von Erstklässlern und dem Ansatz „Lesen durch Schreiben “von Jürgen Reichen in der Videostudie Deutsch des Projekts PERLE. kassel university press. (Online)
  • May, P. (2013). Hamburger Schreib-Probe 1-10 (HSP). Manual (Neunormierung 2012). Klett.
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Reichen, J. (2006). Hannah hat Kino im Kopf. Die Reichen-Methode Lesen durch Schreiben und ihre Hintergründe für LehrerInnen, Studierende und Eltern (4. Aufl.). Heinevetter.
  • Reichen, J (1988). Lesen durch Schreiben (3. Aufl.). sabe.
  • Schründer-Lenzen, A. (2013). Schriftspracherwerb. Springer VS. (Online)
  • Valtin, R. (1998). Der ‚neue‘ Methodenstreit oder: (Was) können wir aus der amerikanischen Leseforschung lernen? In H. Balhorn, H. Bartnitzky, & A. Speck-Hamdan (Hrsg.), Schatzkiste Sprache 1. Von den Wegen der Kinder in die Schrift (S. 14-46). Arbeitskreis Grundschule.

Podcast: Datenliebe

Auch Forschungsdaten wollen umsorgt werden!

Quelle: Verbund Forschungsdaten Bildung

Innerhalb von Projekten der empirischen Bildungsforschung werden eine Menge Daten gesammelt, von Fragebogendaten bis hin zu Interview- und Videoaufnahmen. Der Verbund Forschungsdaten Bildung hat das Ziel, solche Forschungsdaten auch nach dem Abschluss von Forschungsprojekten zu archivieren und für spätere Nachnutzungen anderen Forscher*innen bereit zu stellen. Auch die in unserem Projekt erhobenen Daten werden wir nach Abschluss in ein Archiv zur Sekundärnutzung geben. Beim Verbund Forschungsdaten Bildung handelt es sich um eine Zusammenarbeit dreier großer nationaler Einrichtungen der Bildungsforschung, dem DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, dem GESIS – Leibniz-Institut für Sozialwissenschaften und dem IQB – Institut zur Qualitätsentwicklung im Bildungswesen.

Neben dem kostenfreien Angebot der Datenarchivierung, stellt der Verbund aber auch umfangreiche Informationen für Bildungsforscher*innen und weitere Interessierte um alle Themen zum Umgang mit empirisch gewonnenen Forschungsdaten zur Verfügung. Damit eine Archivierung für die spätere Datennutzung bspw. auch sinnvoll angelegt werden kann, sollte schon bei der Konzeption von Forschungsprojekten eine Vielzahl von Aspekten beachtet werden, die z.B. in einem Datenmanagementplan festgehalten werden sollten (Verbund FDB, 2015). Darüber hinaus muss jegliche Forschung, bei der Daten von Menschen erfasst bzw. erhoben werden, datenschutzrechtlichen und forschungsethischen Grundsätzen folgen. Dies betrifft insbesondere die so genannte informierte Einwilligung von teilnehmenden Personen (Verbund FDB, 2019).

Zu derartigen Fragen und noch einer ganzen Reihe mehr (z.B. zur Datenanonymisierung) bietet die Website des Verbundes zahlreiche Handreichungen und Hintergrundinformationen. Sehr empfehlenswert sind auch die regelmäßigen Schulungsangebote des Verbundes, an denen ich auch schon teilgenommen habe. Nicht zuletzt bietet der Podcast nun auch eine gute Möglichkeit für alle, die sich auch auf dem Weg zur oder von der Arbeit zum Umgang mit Daten fortbilden wollen (oder auch am Wochenende 😉 ).

Literatur:

  • Verbund Forschungsdaten Bildung (2015). Checkliste zur Erstellung eines Datenmanagementplans in der empirischen Bildungsforschung. Version 1.1. DIPF. (Online)
  • Verbund Forschungsdaten Bildung (2019). Checkliste zur Erstellung rechtskonformer Einwilligungserklärungen mit besonderer Berücksichtigung von Erhebungen an Schulen. Version 2.0. DIPF. (Online)

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 3/12 – Teil 2

Todsünde Nr. 2: Ideologien und Visionen bestimmen schulische Reformen

In einer Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei betrachten wir, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Dieser ist der zweite Teil eines Beitrags, der sich mit der zweiten vom Autoren so bezeichneten Todünde beschäftigt. Im ersten Teil wurde die Kernthese des zugehörigen Kapitels genauer betrachtet. Da diese insbesondere am Beispiel der Einführung von Gesamtschulen im deutschen Bildungssystem konkretisiert wird, wurden anschließend theoretische und (ein paar wenige) historische Hintergründe zu Fragen der Gestaltung von gegliederten und aus Gesamtschulen bestehenden Schulsystemen dargestellt. Dieser Beitrag konzentriert sich nun auf die Ergebnisse empirischer Untersuchungen zum Schulsystem und insbesondere zur Wirkung von Gesamtschulen. Thesen aus dem Buch werden auch in diesem Teil im Konjunktiv als indirekte Rede wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll.

Grau ist alle Empirie…

Was ergaben nun diese ersten empirischen Studien zur neu eingeführten integrierten Gesamtschule? Wie bei einem solch komplexen Untersuchungsgegenstand zu erwarten, sind die Ergebnisse ebenfalls komplex und unterscheiden sich je nach untersuchtem Zielbereich, Bundesland und weiterer Faktoren (vgl. zusammenfassend Fend, 1982). Bspw. untersuchten Fend et al. (1976) mit Hilfe einer Befragung von 3750 Schüler*innen der 9. und 10. Schulstufe, 404 Lehrkräften und 548 Eltern aus Baden-Württemberg, Hessen, Hamburg und Berlin, ob im integrierten Gesamtschulsystem im Vergleich mehr Schüler*innen höhere Schulabschlüsse anstrebten oder welche Rolle Intelligenz in verschiedenen Schulsystem spielte. Grob zusammengefasst ergab sich, dass im Gesamtschulsystem mehr Schüler*innen als Abschluss ein Abitur erwarteten (40% gegenüber 23%, Fend et al., 1976, 141) und dass der Zusammenhang zwischen Intelligenz und Leistungen bzw. Leistungsstatus im Gesamtschulsystem im Vergleich niedriger ausfällt (r = .24 gegenüber r = .38, Fend et al., 1976).

Auch im Abschlussbericht der wissenschaftlichen Beratergruppe zum Gesamtschulversuch von Nordrhein-Westfalen (Kultusminister NRW, 1979) werden umfangreiche Ergebnisse zu Vergleichen zwischen Schüler*innen der beiden Schulsysteme berichtet. Allgemein zusammengefasst zeigte sich, dass bezogen auf fachliche Lernleistungen leistungsschwächere Schüler*innen (definiert anhand der Übergangsempfehlung auf eine Hauptschule) in der 6. Klasse an integrierten Gesamtschulen höhere Leistungen erzielten, als die entsprechende Gruppe im gegliederten System. Bei leistungsstärkeren Schüler*innen (Übergangsempfehlung für Realschule oder Gymnasium) sind die Ergebnisse umgekehrt. Dieses Muster ergab sich allerdings nicht mehr für Schüler*innen in der 9. Klasse, in der die Schüler*innen im gegliederten System höhere Leistungen erzielten (siehe hierzu Kultusminister NRW, 1979, 57ff.). Es wurde allerdings auch eine große Varianz zwischen Schulen innerhalb beider Systeme in den Ergebnissen und auch in den Lerngelegenheiten innerhalb der Schulen für die erfassten Fachleistungen festgestellt. Die Ergebnisse werden zudem in Beziehungen aus Hessen gesetzt, die teils umgekehrte Befunde zeigten. Im Bereich der Lehrkräfte-Schüler*innen-Verhältnisse berichteten Gesamtschüler*innen ein höheres Maß an zugestandener Mitbestimmung durch Lehrkräfte und höhere Selbstständigkeitserwartungen als im gegliederten System. Bei Verstößen gegen schulrelevante Normen (z.B. Störungen etc.) ergaben sich keine Unterschiede zwischen den Systemen. Bezogen auf schulische Abschlüsse erwarben Schüler*innen an Gesamtschulen zu geringeren Anteilen einen Hauptschulabschluss, dafür aber einen höheren Anteil der Fachoberschulreife (68% gegenüber 50%, Kultusminister NRW, 1979, 43f.). In den Oberstufen der Gesamtschulen erreichte allerdings ein geringerer Anteil an Schüler*innen das Abitur (73% gegenüber 86% an Gymnasien, Kultusminister NRW, 1979, 44f.). Es wird in diesem Zusammenhang aber auch formuliert: „Für die Bewertung der Erfolgsquote in der gymnasialen Oberstufe der Gesamtschule ist zu berücksichtigen, daß [sic!] an Gesamtschulen mehr als ein Drittel der Schüler eines Eingangsjahrgangs in die gymnasiale Oberstufe eintritt, während im traditionellen Schulsystem nur etwas mehr als ein Fünftel aller Schüler eines Eingangsjahrgangs […] in die Oberstufe übergeht.“ (Kultusminister NRW, 1979, 45).

Allein der Blick in diese zwei Publikationen zeigt für die Beurteilung der integrierten Gesamtschule: Es ist kompliziert ;). Es besteht eine große Varianz zwischen Ergebnissen verschiedener Schulen innerhalb beider Systeme, innerhalb einzelner Schulen und in den Systemen einzelner Bundesländer (es gibt also auch Überlappungen zwischen den Schulformen, also dass z.B. an bestimmten Gesamtschulen durchschnittlich höhere Leistungen erzielt wurden, als an bestimmten Realschulen oder Gymnasien). Unterschiede in den Curricula und Lerngelegenheiten erschweren zudem einen guten Vergleich. Im letztgenannten Zitat deutet sich eine Schwierigkeit an, die beim Vergleich verschiedener Schulsysteme immer wieder eine Rolle spielt: Es kommt immer darauf an, mit welchen Voraussetzungen Schüler*innen in verschiedene Schulformen übergehen. Um Gesamtschulen und gegliederte Schulsysteme gut vergleichen zu können, wäre es notwendig, dass sich Schüler*innen in den Voraussetzungen möglichst stark ähneln, weil dann Unterschiede in Lernzuwächsen auch deutlich auf das Schulsystem zurückgeführt werden können (wenn man mal davon absieht, dass es noch andere Einflüsse wie die Ausbildung von Lehrkräften etc. gibt).

Das Problem der Eingangsselektivität

Man spricht hierbei auch von der Eingangsselektivität (vgl. Pfost et al., 2010; Ditton & Krüsken, 2006), was meint, dass Schüler*innen sich schon beim Übergang von der Grundschule auf die weiterführende Schulform stark in für das Lernen relevanten Merkmalen unterscheiden. Es ist ein gut belegter Befund der empirischen Bildungsforschung, dass die schulische Leistung von Schüler*innen stark mit den von ihnen ‚mitgebrachten‘ Voraussetzungen zusammenhängen (vgl. Renkl, 2020; vgl. Maaz et al., 2007). Dies meint nicht nur die kognitiven Fähigkeiten oder das Vorwissen aus der Grundschule, sondern auch Aspekte wie den sozio-ökonomischen Status der Familie (z.B. über wieviel Geld eine Familie für weitere Bildungsausgaben verfügt, Berufstätigkeit der Eltern), das Bildungsniveau der Familie (z.B. Abschlüsse der Eltern, Zugang zu Bildungsmedien), oder der Migrationsstatus der Familie (z.B. Kenntnis der Unterrichtssprache) (vgl. Watermann & Baumert, 2006).

Die Eingangsselektivität ist im deutschen Schulsystem relativ groß und es bestehen große Unterschiede zwischen den Voraussetzungen von Schüler*innen der verschiedenen Schulformen. Man spricht in diesem Zusammenhang auch von der Komposition der Schülerschaft einer Schule oder Schulform (vgl. Baumert et al., 2006). Im IQB-Bildungstrend 2018, der aktuellsten veröffentlichten, auf deutschlandweit repräsentativen Daten für die Sekundarstufe I (bezogen auf die 9. Klasse) beruhenden Untersuchung, wurde bspw. beobachtet, dass sich die Zusammensetzung der Schülerschaft an Gymnasien und nicht-gymnasialen Schulformen stark unterscheidet. So hatte an Gymnasien im Jahr 2018 ein Anteil von MW = 27,7% (SD = 19,7%) der Schüler*innen einen Zuwanderungshintergrund (mindestens ein im Ausland geborener Elternteil), an nicht-gymnasialen Schulformen demgegenüber MW = 34,4% (SD = 25,6%) (Schipolowski et al., 2019, 148). Ebenso hatten an Gymnasien MW = 60,8% (SD = 7,4%) der Schüler*innen einen mittleren sozio-ökonomischen Status (erfasst mit dem HISEI (Highest International Socio-Economic Index of Occupational Status), vgl. Ganzeboom et al., 1992). An nicht-gymnasialen Schulformen betrug dieser Anteil MW = 42,3% (SD = 7,5%).

Seit den ersten Studien zur integrierten Gesamtschule hat sich im deutschen Schulsystem viel verändert. Ihr Anteil ist gestiegen und es wurden eine Reihe größere large-scale-assessments durchgeführt, die es ermöglichen, Unterschiede in Leistungsständen und Lernverläufen zwischen verschiedenen weiterführenden Schulformen zu betrachten. Auf Basis von Daten der BIJU-Studie (Bildungsprozesse und psychosoziale Entwicklung im Jugendalter), in der von N = 2964 Schüler*innen in der 7. und 10. Klasse mit standardisierten Tests Leistungen im Fach Mathematik und Englisch erfasst wurden, konnten bspw. Köller & Baumert (2001) feststellen, dass sich die Leistungen der Schüler*innen je nach Schulform unterschiedlich entwickeln. Am Gymnasium erreichten Lernende in Klasse 10 die höchsten Werte, lagen aber auch in Klasse 7 schon über den anderen Schulformen. Die Leistungen von Schüler*innen an integrierten Gesamtschulen lagen zwischen denen an Haupt- und Realschulen. Zugleich ergaben sich Unterschiede dahingehend, dass sich auch die Zuwächse an den Schulformen unterschieden, bspw. nahmen die Leistungen im Fach Englisch an Gymnasien auch stärker zu, als an den anderen Schulformen (Baumert et al., 2006). Ähnliche Muster konnten auch in den verschiedenen PISA-Studien beobachtet werden. Bspw. erreichten Schüler*innen an Gymnasien in der PISA-Untersuchung 2012 (N = 5001 15-jährige Schüler*innen, davon ca. 24,3% an einer Form der Gesamtschule) durchschnittlich den höchsten Wert in allen Kompetenzbereichen. Die durchschnittlichen Leistungen von Schüler*innen an Gesamtschulen lagen zwischen den Mittelwerten der Haupt- und der Realschule (z.B. Mathematik: Sälzer et al., 2013b, Naturwissenschaften: Schiepe-Tiska et al., 2013). Auch hier lag – wie schon aus älteren Untersuchungen bekannt – eine starke Varianz der Werte zwischen einzelnen Schüler*innen vor, so dass sich größere Überlappungsbereiche auch zwischen den Schulformen ergaben. In den IQB-Ländervergleichen bzw. Bildungstrends sowie in den PISA-Studien 2015 und 2018 wurden nur das Gymnasium und nicht-gymnasiale Schulformen unterschieden (vgl. hierzu auch Hurrelmann, 2013), wobei Schüler*innen an Gymnasien insgesamt häufiger höhere Kompetenzstufen erreichten (vgl. Reiss et al., 2019; vgl. Reiss et al., 2016; Kölm & Mahler, 2019; Pant et al., 2013). Der von Heinz-Peter Meidinger formulierte „beispiellose Absturz“ (Meidinger, 2021, 39) Baden-Württembergs in nationalen Schulleistungsvergleichen ab 2016 zeigt sich im IQB-Bildungstrend bspw. wie folgt. Der Anteil von Schüler*innen, die den Mindeststandard in Mathematik nicht erreicht hat, sank zwischen den Bildungstrends 2012 und 2018 um ca. 1% und der Anteil, der den Regelstandard erreichte oder übertraf stieg um ca. 2,8% (Kölm & Mahler, 2019, 163f.). Wohl sank aber der Anteil von Schüler*innen an Gymnasien, die den Optimalstandard erreichten (um ca. 5,5%, Kölm & Mahler, 2019, 166). Eine genauere Unterscheidung zwischen Schulformen ist auf Basis der veröffentlichten Daten allerdings nicht möglich.

In allen diesen Untersuchungen wird aber auch ein starker Zusammenhang zwischen Schüler*innenleistungen und dem sozio-ökonomischen, familiären Hintergrund festgestellt, wobei ein ’schwächerer‘ Hintergrund mit schwächeren Leistungen einhergeht (z.B. Mahler & Kölm, 2019; Müller & Ehmke, 2013; vgl. Maaz et al., 2007). Dieser starke Zusammenhang zwischen Voraussetzungen und Lernleistungen erschwert und der stark unterschiedliche Anteil von Schüler*innen bzgl. dieser Voraussetzungen auf unterschiedliche Schulformen erschwert den Vergleich der Wirkungen von Gesamtschulen und einem gegliederten Schulsystem. Inwiefern können Unterschiede in Lernleistungen nun hauptsächlich auf die Schulform (und bspw. damit die Zusammensetzung der Schüler*innenschaft nach Fähigkeiten) zurückgeführt werden, wenn andere Einflussfaktoren so ungleich verteilt sind? Baumert et al. (2006) haben bspw. anhand von Querschnitts-Daten der nationalen Erweiterung der ersten PISA-Studie 2000 untersucht, zu welchem Anteil Unterschiede in den Testergebnissen zur Lesekompetenz zwischen Schulen durch Unterschiede auf der individuellen (z.B. kognitive Fähigkeit, sozio-ökonomischer Status) oder auf institutionellen Ebene (z.B. Schulform, mittleres Leistungsniveau einer Klasse) erklärt werden können. Hierfür berechneten sie komplexe Mehrebenen-Regressionsmodelle. Den größten Einfluss auf individueller Ebene hatten dabei die kognitive Grundfähigkeit (positiv), falls in Deutsch nicht Familiensprache war (negativ) und wenn die Eltern über keine Berufsausbildung verfügten (negativ). Auf institutioneller Ebene hatte die mittlere kognitive Grundfähigkeit einer Klasse, aber auch sie Schulform einen signifikanten Einfluss. Unterschiede zwischen Schulen konnten dabei zum größten Teil durch konfundierte Faktoren erklärt werden, also Faktoren, die das Zusammenwirken mehrerer einzelner Variablen betrachtet (z.B. mittleres Fähigkeitsniveau, Schulform, mittleres Bildungsniveau der Eltern). Der ‚reine‘ Anteil der Schulform war eher gering (Baumert et al., 2006, S. 132). Auch hier zeigt sich, dass die Eingangsselektivität von Schulformen einen großen Einfluss darauf hat, wie Ergebnisse von Leistungsvergleichen zwischen Schulen ausfallen.

Ein Blick in noch aktuellere Analysen

Die Frage danach, ob ein gegliedertes Schulsystem gegenüber einem System aus Gesamtschulen bessere Lernleistungen erzeugt, wurde auch in noch aktuelleren Untersuchungen erneut betrachtet. Esser & Seuring (2020) analysierten, ob innerhalb der deutschen Bundesländer Schulsysteme nach ‚Schärfe‘ der Verteilung von Schüler*innen nach Leistungen bzw. Leistungsfähigkeit nach der Grundschule auf weiterführende Schulformen (operationalisiert nach der Verbindlichkeit der Übergangsempfehlung) Unterschiede hinsichtlich der Lernleistungen bestehen. Vermutet wurde auf Grundlage des komplexen MoAbiT (Model of Ability Tracking, Esser, 2016), dass innerhalb der Schulformen im Vergleich insgesamt höhere Leistungen erzielt werden und dass die Unterschiede zwischen Schüler*innen aufgrund der Voraussetzungen (z.B. sozio-ökonomischer Hintergrund) durch die Differenzierung nicht zunehmen. Grundlage bildeten Daten einer (nicht-repräsentativen) Kohorte Schüler*innen (N = 2662, 13 Bundesländer) in der National Educational Panel Study (NEPS, Blossfeld et al., 2011), deren Leistungen im Lesen und in Mathematik erfasst wurden. Grob zusammengefasst berichten die Autoren auf Basis komplexer hierarchischer Regressionsmodelle, dass ihre Annahmen zutreffen, und kognitive homogenere Schulformen einen Vorteil für die Leistungsentwicklung bilden.

Wurde nun gezeigt, dass gegliederte Schulsysteme vorteilhafter sind als Gesamtschulsysteme? Heisig & Matthewes (2022) argumentieren, dass dies nicht geschlossen werden kann, da kein Schulsystem mit Gesamtschulen mit gegliederten Systemen verglichen wurde, sondern verschiedene gegliederte Schulsysteme untereinander. Sie können allerdings auf Basis desselben Datensatzes und denselben Analysemethoden die Ergebnisse von Esser & Seuring (2020) nicht replizieren. Der Grund hierfür ist auch hier (unter anderem) wieder die Eingangsselektivität verschiedener Schulformen, deren Kontrolle in der Erststudie auch Heisig & Matthewes (2022) kritisieren. Als zentrales Maß der Fähigkeit wurden Maße der kognitiven Fähigkeit zu Beginn von Klasse 5 verwendet. Wurde aber zusätzlich kontrolliert, dass sich Grundschüler*innen in Bundesländern mit unterschiedlich ’strikten‘ Verteilungen nach Fähigkeiten auf weiterführende Schulformen schon vor dem Übergang unterscheiden, dann ließen sich die Ergebnisse von Esser & Seuring (2020) nicht mehr replizieren. Grundschüler*innen unterscheiden sich zwischen den Bundesländern stark bzgl. ihrer Kompetenzen im Lesen und in Mathematik, was auch wiederum mit dem sozio-ökonomischen Hintergrund zusammenhängt (Stanat et al., 2022). Lorenz & Lenz (2022) nutzten die repräsentativen Daten der IQB-Bildungstrends 2015 und 2018 (N = 28.625 Schüler*innen (Deutsch) bzw. 20.772 Schüler*innen (Mathematik)) und versuchten die Ergebnisse von Esser & Seuring (2020) ebenfalls zu replizieren. Sie kamen zu folgendem Ergebnis: „Allerdings unterschied sich die kognitive Homogenität nur in der Stichprobe aus dem Jahr 2015 signifikant zwischen den Systemen. Ein (scheinbar systembedingter) Leistungsvorteil in den Bundesländern mit einer strikten Leistungsdifferenzierung konnte wiederum nur für die Stichprobe aus dem Jahr 2018 und den Kompetenzbereich Mathematik festgestellt werden.“ (Lorenz & Lenz, 2022). Effekte ließen sich also nur teilweise zeigen, wobei die Mechanismen des MoAbiT nicht bestätigt werden konnten. Zusätzlich sehen Lorenz & Lenz (2022) die Tendenz, dass leistungsschwächere Schüler*innen in ’strikt‘ differenzierenden Systemen weniger von einer kognitiven Homogenisierung profitieren, und sie weisen auf die Unterschiede zwischen den Voraussetzungen in den Bundesländern hin.

Fazit

Was kann die empirische Bildungsforschung nun zur Gesamtschule sagen? Ist ein Schulsystem aus Gesamtschulen, also einer Schulform nach der Grundschule für alle Schüler*innen, einem gegliederten System überlegen? Oder ist sie in den Worten von Heinz-Peter Meidinger „umfassend und klar gescheitert“ (Meidinger, 2021, 38). Trotz vieler komplexer Analysen und umfangreicher Untersuchungenn lässt sich dies nicht pauschal mit ‚Nein‘ oder ‚Ja‘ beantworten.

Ein Grund hierfür ist eher forschungsmethodischer Natur. Um Unterschiede zwischen Schulsystemen eindeutig auf die Schulformorganisation zurückführen zu können, müssten im idealen Fall zwei Gruppen von Schüler*innen unterschieden werden, die in der Verteilung möglichst aller lernrelevanten Einflussfaktoren (z.B. kognitive Fähigkeiten, sozio-ökonomischer Hintergrund, Familiensprache) hinreichend gleich sind, sich aber nur darin unterscheiden, in was für einem schulischen System sie in ihrer Schullaufbahn unterwegs sind (und auch dann müssten die zur Verfügung stehenden Lerngelegenheiten, Ausbildung der Lehrkräfte u.v.a hinreichend ähnlich sein). Eine solche Studie bzw. eine solche Ausgangslage wird sich aber unter Realbedingungen kaum herstellen lassen. Solange Gesamtschulen neben den traditionellen Schulen des dreigliedrigen Schulsystems bestehen, wird es aufgrund vieler Gründe so gut wie immer dazu kommen, dass sich bzgl. der Voraussetzungen der Schüler*innen unterschiedliche Verteilungen in verschiedenen Schulformen ergeben und daher eine gewisse Eingangsselektivität bestehen bleiben. Das hat auch damit zu tun, dass mit unterschiedlichen Schulabschlüssen auch bei sonst vergleichbaren Lernleistungen der Schüler*innen stark unterschiedliche weitere Lebenschancen einhergehen (z.B. Schuchart, 2007) und dies den Beteiligten auch bewusst ist.

Ein anderer Grund liegt darin, dass die vorliegenden Forschungsergebnisse auch darauf hindeuten, dass es für die Förderung inhaltsbezogener Kompetenzen weniger auf die äußere strukturelle Gestaltung von Schule ankommt, sondern auf die innere Gestaltung, also darauf, was konkret mit den Schüler*innen im Unterricht gemacht wird. Anders gesagt, es hat einen größeren Effekt, wenn die konkreten Lerngelegenheiten einer konkreten Klasse möglichst qualitätsvoll sind (vgl. Gräsel & Göbel, 2022), als wenn das gesamte System einer bestimmten Struktur folgt. Das soll nicht bedeuten, dass das Schulsystem keine Rolle spielt, es existieren nur eine Menge anderer Stellschrauben, an denen ebenfalls gedreht werden könnte, um Lernleistungen zu verbessern, die nicht auf der obersten Strukturebene liegen. Oder wie Hattie (2002) es formuliert: „Good teaching can occur independently of the class configuration or homogeneity of the students within the class.“ (Hattie, 2002, 449)

Einen bestimmten, positiven Effekt hat die Einführung von Gesamtschulen bzw. die damit verbundenen Untersuchungen und Diskussionen allerdings auf jeden Fall ergeben. Durch sie wurden auch affektiv-emotionale Aspekte der Schule (z.B. Leistungsangst, Schulstress) in der empirischen Bildungsforschung stärker untersucht und insbesondere auch in anderen Schulformen in den Fokus genommen (vgl. Mattes, 2017). Die dritte Todsünde der Bildungspolitik wird Gegenstand des nächsten Beitrags in dieser Artikelreihe sein. Er wird an dieser Stelle verlinkt, sobald er online zugänglich ist.

Literatur:

  • Baumert, J., Stanat, P., & Watermann, R. (2006). Schulstruktur und die Entstehung differenzieller Lern- und Entwicklungsmilieus. In J. Baumert, P. Stanat, & R. Watermann, (Hrsg.), Herkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Verteilungsgerechtigkeit (S. 95-188). VS Verlag für Sozialwissenschaften. (Online)
  • Blossfeld, H.P., & H.G. Roßbach (Hrsg.) (2011). Education as a Lifelong Process – The German National Educational Panel Study (NEPS). Springer VS. (Online)
  • Ditton, H., & Krüsken, J. (2006). Der Übergang von der Grundschule in die Sekundarstufe I. Zeitschrift für Erziehungswissenschaft, 9, 348-372. (Online)
  • Esser, H. (2016). Bildungssysteme und ethnische Bildungsungleichheit. In C. Diehl, C. Hunkler, & C. Kristen (Hrsg.), Ethnische Ungleichheiten im Bildungsverlauf. Mechanismen, Befunde, Debatten (S. 331-396). Springer VS. (Online)
  • Esser, H., & Seuring, J. (2020). Kognitive Homogenisierung, schulische Leistungen und soziale Bildungsungleichheit. Zeitschrift für Soziologie, 49(5-6), 277-301. (Online)
  • Fend, H., Knörzer, W., Nagl, W., Specht, W., & Väth-Szusdziara, R. (1976). Gesamtschule und dreigliedriges Schulsystem. Eine Vergleichsstudie über Chancengleichheit und Durchlässigkeit. Klett Verlag.
  • Fend, H. (1982). Gesamtschule im Vergleich. Bilanz der Ergebnisse des Gesamtschulversuchs. Beltz.
  • Ganzeboom, H. B., De Graaf, P. M., & Treiman, D. J. (1992). A standard international socio-economic index of occupational status. Social Science Research, 21(1), 1-56. (Online)
  • Gräsel, C., & Göbel, K. (2022). Unterrichtsqualität. In H. Reinders, D. Bergs-Winkels, A. Prochnow, & I. Post (Hrsg.), Empirische Bildungsforschung (S.663-674). Springer VS. (Online)
  • Hattie, J. A. (2002). Classroom composition and peer effects. International Journal of Educational Research, 37(5), 449-481. (Online)
  • Heisig, J. P., Elbers, B., & Solga, H. (2020). Cross-national differences in social background effects on educational attainment and achievement: absolute vs. relative inequalities and the role of education systems. Compare: A Journal of Comparative and International Education, 50(2), 165-184. (Online)
  • Heisig, J. P., & Matthewes, S. H. (2022). No Evidence that Strict Educational Tracking Improves Student Performance through Classroom Homogeneity: A Critical Reanalysis of Esser and Seuring (2020). Zeitschrift für Soziologie, 51(1), 99-111. (Online)
  • Köller, O., & Baumert, J. (2001). Leistungsgruppierungen in der Sekundarstufe I. Ihre Konsequenzen für die Mathematikleistung und das mathematische Selbstkonzept der Begabung. Zeitschrift für Pädagogische Psychologie, 15(2), 99-110. (Online)
  • Kölm, J., & Mahler, N. (2019). Kompetenzstufenbesetzungen im Ländervergleich. In P. Stanat, S. Schipolowski, N. Mahler, S. Weirich, & S. Henschel. (Hrsg.), (2019). IQB-Bildungstrend 2018. Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I im zweiten Ländervergleich (S. 157-200). Waxmann. (Online)
  • Kultusminister des Landes NRW (Hrsg.) (1979). Gesamtschule in Nordrhein-Westfalen – Ergebnisberichte. Grevenverlag.
  • Lorenz, G., & Lenz, S. (2022). Vorteile Kognitiver Homogenisierung? Replikation einer Studie von Hartmut Esser und Julian Seuring zu den Auswirkungen von atrikter Leistungsdifferenzierung auf Schulleistungen und Bildungsungleichheit. Preprint. (Online)
  • Maaz, K., Watermann, R., & Baumert, J. (2007). Familiärer Hintergrund, Kompetenzentwicklung und Selektionsentscheidungen in gegliederten Schulsystemen im internationalen Vergleich. Eine vertiefende Analyse von PISA Daten. Zeitschrift für Pädagogik, 53(4), 444-461. (Online)
  • Mahler, N., & Kölm, J. (2019). Soziale Disparitäten. In P. Stanat, S. Schipolowski, N. Mahler, S. Weirich, & S. Henschel. (Hrsg.), (2019). IQB-Bildungstrend 2018. Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I im zweiten Ländervergleich (S. 265-294). Waxmann. (Online)
  • Mattes, M. (2017). Von der Leistungs- zur Wohlfühlschule? Die Gesamtschule als Gegenstand gesellschaftlicher Debatten und pädagogischer Wissensproduktion in der Bundesrepublik Deutschland in den 1970er und 1980er Jahren. In S., Rehm E. Glaser, B. Behm, & T. Drope (Hrsg.), Wissen machen. Beiträge zu einer Geschichte erziehungswissenschaftlichen Wissens in Deutschland zwischen 1945 und 1990. Zeitschrift für Pädagogik – 63. Beiheft (S. 187-206). Beltz Juventa. (Online)
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Müller, K., & Ehmke, T. (2013). Soziale Herkunft als Bedingung der Kompetenzentwicklung. In M. Prenzel, C. Sälzer, E. Klieme, & O. Köller (Hrsg.), PISA 2012 – Fortschritte und Herausforderungen in Deutschland (S. 245-274). Waxmann. (Online)
  • Pand, H-A., Stanat, P., Pöhlmann, C., Hecht, M., […], & Ziemke, A. (2013). Der Blick in die Länder. In H-A. Pand, P. Stanat, U. Schroeders, A. Roppelt, T. Siegle, & C. Pöhlmann (Hrsg.), IQB-Ländervergleich 2012 – Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I (S. 159-247). Waxmann.
  • Pfost, M., Karing, C., Lorenz, C., & Artelt, C. (2010). Schereneffekte im ein-und mehrgliedrigen Schulsystem. Zeitschrift für Pädagogische Psychologie, 24, 258-272. (Online)
  • Reiss, K., Sälzer, C., Schiepe-Tiska, Klieme, E., & Köller, O. (Hrsg.) (2016). PISA 2015 – Eine Studie zwischen Kontinuität und Innovation. Waxmann. (Online)
  • Reiss, K., Weis, M., Klieme, E., & Köller, O. (Hrsg.) (2019). PISA 2018 – Grundbildung im internationalen Vergleich. Waxmann. (Online)
  • Renkl, A. (2020). Wissenserwerb. In E. Wild, & J. Möller (Hrsg.), Pädagogische Psychologie (S. 3-24). Springer. (Online)
  • Roller, M., & Steinberg, D. (2020). The distributional effects of early school stratification-non-parametric evidence from Germany. European Economic Review, 125, 103422. (Online)
  • Sälzer, C., Reiss, K., Schiepe-Tiska, Prezel, M., & Heinze, A. (2013b). Zwischen Grundlagenwissen und Anwendungsbezug: Mathematische Kompetenz im internationalen Vergleich. In M. Prenzel, C. Sälzer, E. Klieme, & O. Köller (Hrsg.), PISA 2012 – Fortschritte und Herausforderungen in Deutschland (S. 47-98). Waxmann. (Online)
  • Schiepe-Tiska, A., Schöps, K., Rönnebeck, S., Köller, O., & Prenzel, M. (2013). Naturwissenschaftliche Kompetenz in PISA 2012: Ergebnisse und Herausforderungen. In M. Prenzel, C. Sälzer, E. Klieme, & O. Köller (Hrsg.), PISA 2012 – Fortschritte und Herausforderungen in Deutschland (S. 189-216). Waxmann. (Online)
  • Schipolowski, S., Stanat, P., Mahler, N., & Lenz, S. (2019). Kontextinformationen zu den Schulsystemen der Länder in der Sekundarstufe I. In P. Stanat, S. Schipolowski, N. Mahler, S. Weirich, & S. Henschel. (Hrsg.), (2019). IQB-Bildungstrend 2018. Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I im zweiten Ländervergleich (S. 131-156). Waxmann. (Online)
  • Schuchart, C. (2007). Schulabschluss und Ausbildungsberuf: Zur Bedeutung der schulartbezogenen Bildungsbiografie. Zeitschrift für Erziehungswissenschaft, 10, 381-398. (Online)
  • Stanat, P., Schipolowski, S., Schneider, R., Sachse, K-A., Weirich, S., & Henschel, S. (Hrsg.) IQB-Bildungstrend 2021. Kompetenzen in den Fächern Deutsch und Mathematik am Ende der 4. Jahrgangsstufe im dritten Ländervergeleich. Waxmann. (Online)
  • Tillmann, K.-J. (2012). Das Sekundarschulsystem auf dem Weg in die Zweigliedrigkeit. Pädagogik, 64(5), 8-12. (Online)
  • Watermann, R., & Baumert, J. (2006). Entwicklung eines Strukturmodells zum Zusammenhang zwischen sozialer Herkunft und fachlichen und überfachlichen Kompetenzen: Befunde national und international vergleichender Analysen. In J. Baumert, P. Stanat, & R. Watermann, (Hrsg.), Herkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Verteilungsgerechtigkeit (S. 61-94). VS Verlag für Sozialwissenschaften. (Online)

Podcast: Fachgespräche Lehrerinnen- und Lehrerbildung – Nachtrag

Lehrerbildung und Fachdidaktik

Quellennachweis: Tübingen School of Education

In einem Blogbeitrag im November haben wir schon auf die Veranstaltungsreihe „Fachgespräche Lehrerinnen- und Lehrerbildung. Forschung. Diskurs.Perspektiven“ hingewiesen, in der verschiedene Fragen und Herausforderungen der Lehrkräftebildung von eingeladenen Expert*innen diskutiert werden.

Zum Thema „Herausforderungen institutionalisierter Lehrkräftebildung“ war ich (Christoph) als Vertreter der next generation, also als Forscher, dessen akademische Karriere eher noch am Anfang steht, eingeladen einen kurzen Vortrag zu halten; nach Beiträgen von Prof. Dr. Michael Hemmer (Universität Münster, Didaktik der Geographie), critical friend ist Prof. Dr. Sabine Doff (Universität Bremen, Fremdsprachendidaktik Englisch).

Die Aufzeichnung zu diesem Abend ist schon länger auf dem YouTube-Kanal der „Tübingen School of Education“ erschienen und kann dort (allerdings ohne die nachfolgende Diskussionsrunde) gesehen und gehört werden (bei Beitrag beginnt bei Minute 56:12 ;)). Es war ein sehr gelungener Abend und ich möchte mich auch an dieser Stelle noch einmal bei den Organisator*innen und Michael Hemmer und Sabine Doff bedanken.

Es war ein höchst interessanter Austausch zur fachdidaktischen Sicht auf eine Frage bzgl. der Lehrkräftebildung (z.B. das Verhältnis von Theorie und Praxis). Generell wird der Status der Fachdidaktik als Wissenschaftsdisziplin und welche spezifischen Perspektiven sie zur Ausbildung von Lehrer*innen beiträgt bzw. beitragen soll immer mal wieder diskutiert (z.B. Rothland, 2022). Ich hoffe, dass unsere Vorträge hier zur Klärung etwas beitragen konnten.

Die gesamte Veranstaltungsreihe ist sehr empfehlenswert! Der Flyer zur zweiten Staffel ist weiterhin online hier zu finden.

Literatur:

  • Doff, S. (2022, 23. November). RESPONSE zu: Prof. Dr. M. Hemmer – Herausforderungen institutionalisierter Lehrkräftebildung aus Perspektive der Fachdidaktiken. Vortrag im Rahmen der Veranstaltungsreihe „Fachgespräche Lehrerinnen- und Lehrerbildung. Forschung. Diskurs. Perspektiven“, Staffel 2. Virtuell/Tübingen.
  • Hemmer, M. (2022, 23. November). Herausforderungen institutionalisierter Lehrkräftebildung aus Perspektive der Fachdidaktiken. Vortrag im Rahmen der Veranstaltungsreihe „Fachgespräche Lehrerinnen- und Lehrerbildung. Forschung. Diskurs. Perspektiven“, Staffel 2. Virtuell/Tübingen.
  • Rothland, M. (2022). „Theorie“ und „Praxis“ in der Lehrer:innenbildung: Auf der Suche nach fachspezifischen Verhältnisbestimmungen in den Fachdidaktiken. Zeitschrift für Bildungsforschung,
  • Vogelsang, C. (2022, 23. November). Herausforderungen institutionalisierter Lehrkräftebildung aus Perspektive der Fachdidaktiken. Vortrag im Rahmen der Veranstaltungsreihe „Fachgespräche Lehrerinnen- und Lehrerbildung. Forschung. Diskurs. Perspektiven“, Staffel 2. Virtuell/Tübingen.

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 3/12 – Teil 1

Todsünde Nr. 2: Ideologien und Visionen bestimmen schulische Reformen

In einer Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Dabei betrachten wir, wie Prämissen und Argumentationen im Buch vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Nachdem wir im vorherigen Beitrag die erste der vom Autoren so bezeichneten „zehn Todsünden der Schulpolitik“ betrachtet haben, folgt in diesen Beitrag die zweite. Für die weiteren Ausführungen ist eine Kenntnis des entsprechen Buchkapitels hilfreich, weshalb es empfehlenswert ist, es zuvor zu lesen. Thesen aus dem Buch werden im Konjunktiv als indirekte Rede wiedergegeben, was keine Zustimmung oder Ablehnung implizieren soll. Es ist ein relativ langer Text geworden, was im Wesentlichen an der Komplexität des im Kapitel behandelten Themas liegt. Daher wurde er für das Blog in zwei Beiträge aufgeteilt.

Ideolog*innen bestimmen bildungspolitische Entscheidungen?

Todsünde Nr. 2 bzw. die Kernthese dieses Kapitels lässt sich dahingehend zusammenfassen, dass viele bildungspolitische Entscheidungen nicht zur Lösung konkreter Sachfragen oder Probleme, sondern aufgrund von, aus Sicht des Autoren, fragwürdiger ideologischer Zielvorstellungen getroffen würden. Er kritisiert, dass aus dieser Perspektive „Schulpolitik der Realisierung einer Utopie zu dienen hat, in erster Linie also Mittel zum Zweck ist, […] um eine vermeintlich bessere Gesellschaft durchzusetzen“ (Meidinger, 2021, 34). Aus diesem ideologisch geprägten Umgang mit bildungspolitischen Fragen, folgen aus Sicht des Autors vier negative Konsequenzen.

  1. Bei Bildungsfragen ginge es nicht um korrekte oder falsche Sachentscheidungen, sondern darum, „[…] ob man auf der Seite des Guten […] steht oder nicht.“ (Meidinger, 2021, 35)
  2. Diskussionen über Schulthemen verliefen zunehmend emotionalisiert und in Freund-Feind-Schemata.
  3. Es bestünde zwischen verschiedenen Beteiligten keine für die Arbeit in und an Schule wichtige Kompromissfähigkeit mehr.
  4. Alle Beteiligten interpretierten die Ergebnisse von Bildungsstudien so, dass es die eigene Sicht auf bildungspolitische Entscheidungen stützte.

„Eine Schule für alle“ als Beispiel ideologischer Bildungsreformen

Heinz-Peter Meidinger erläutert seine Kernthese aus diesem Abschnitt an der Frage nach der strukturellen Organisation von Schule, noch konkreter an „[…] einem heftigen bis heute andauernden Kampf um Schulstrukturen, insbesondere die Ersetzung des gegliederten Schulwesens durch Gesamtschulen“ (Meidinger, 2021, 34). Er bezieht sich auf die Diskussionen zur Einführung von Gesamtschulen in den 1970er Jahren und beschreibt anschließend die Einführung von Gemeinschaftsschulen (grob: Zusammenführung von Haupt- und Realschulen) in Baden-Württemberg im Jahr 2011 als ideologisch motiviert. Diese Einführung (in Verbindung mit z.B. dem Wegfall verbindlicher Übergangsempfehlungen) habe zu einer Verschlechterung von Lernerfolgen in nationalen Schulleistungsvergleichen ab dem Jahr 2016 geführt. Als positiv wird beurteilt, dass die im selben Zeitraum in Hamburg diskutierte Verlängerung der Grundschulzeit um zwei Jahre, eingeordnet als ebenfalls ideologisch motivierte Einführung einer Art Einheitsschule, nicht umgesetzt wurde. Danach habe man in Hamburg die „wirklichen Problemfelder“ (Meidinger, 2021, 42) angegangen (z.B. mangelnde Lernerfolge). Als ähnlich ideologisch motivierte Überlegungen wird in diesem Kapitel ebenfalls die Inklusion von Schüler*innen mit Förderbedarfen in Regelschulen (verbunden mit Schließungen von Förderschulen) beschrieben. Demgegenüber wird an mehreren Stellen des Kapitels mehr oder weniger explizit gefordert, sich bei Änderungen an der Schulstruktur stärker an empirischer Evidenz zu orientieren (z.B. Meidinger, 2021, 34 oder 49).

Zusammengefasst lässt sich festhalten, dass Heinz-Peter Meidinger sich für ein Beibehalten einer mehrgliedrigen Schulstruktur ausspricht bzw. diese nicht durch ein System aus Gesamtschulen zu ersetzen. Zentrale Prämisse hierfür ist die im folgenden Zitat ausgedrückte Bewertung der Gesamtschule:

„Gemessen am eigenen Anspruch ist in Deutschland kaum ein Schulmodell so umfassend und klar gescheitert wie die Gesamt- oder Gemeinschaftsschule. Sie hat weder zu besseren Leistungen, noch zu mehr Bildungsgerechtigkeit, noch zu den erhofften höheren sozialen Kompetenzen geführt.“

(Meidinger, 2021, 38)

Umgekehrt folgt aus diesem Urteil, dass das bestehende Schulsystem mit mehreren Schularten bessere Wirkungen als ein System bestehend aus Gesamtschulen hat bzw. zumindest keine schlechteren. Wobei dies eine Interpretation meinerseits ist und von Heinz-Peter Meidinger im Kapitel nicht so explizit formuliert wird.

Aufbau von Schulsystemen

Die Auswirkung verschieden strukturierter Schulsysteme zu untersuchen, erfordert Forschungsprojekte, die – bezogen auf das Forschungsdesign, die notwendigen Datenerhebungen und die Auswertemethoden – sehr komplex und aufwendig sind. In diesem Blogbeitrag kann daher kein umfassender Einblick gegeben werden, aber ich werde versuchen, einen hinreichenden Überblick zu geben, sodass die oben formulierte Prämisse im Licht der empirischen Bildungsforschung zumindest grob eingeschätzt werden kann. Die Inklusion von Schüler*innen mit Förderbedarfen in Regelschulen wird dabei ausgeklammert (auch weil hierzu die vorliegende Datenlage im Vergleich weniger umfangreich ist).

Es geht im Kern um die Frage, wie ein Schulsystem gestaltet werden sollte, damit die mit der Schule verbundenen Ziele (insbesondere der Aufbau fachlicher oder sozialer Kompetenzen von Schüler*innen) möglichst optimal erreicht werden. In der englischsprachigen Literatur wird in diesem Zusammenhang von explicit tracking oder between-school tracking (vgl. Chmielewski, 2014) gesprochen, also der Aufteilung von Schüler*innen auf verschiedene Schulformen nach bestimmten Kriterien (z.B. nach Fähigkeiten, ability tracking). Implicit tracking oder within-school tracking bezeichnet hingegen die Aufteilung auf z.B. Kurse unterschiedlicher Fähigkeitsniveaus innerhalb einer Schulform, in Deutschland bspw. die Unterscheidung zwischen Grund- und Leistungskursen in der Oberstufe. Die Unterscheidung zwischen Gesamtschulsystemen und differenzierenden Schulsystemen ist allerdings etwas pauschal, da in den meisten Ländern das System in verschiedene Schularten gegliedert ist (Eurydice, 2022; vgl. Klieme et al., 2007). Wesentliche Unterschiede bestehen aber darin, ab welchem Alter sich Schüler*innen auf leistungsdifferenzierende Schulformen aufteilen (vgl. Sälzer et al., 2013a). In Deutschland erfolgt dies im Alter von zehn Jahren und damit im internationalen Vergleich eher früh (vgl. Klieme et al., 2007). Die Grundschule ist in allen Ländern eine Form der Gesamtschule, die von den meisten Schüler*innen besucht wird. Insofern geht es bei der Unterscheidung zwischen Gesamtschul- und gegliederten Systemen primär um weiterführende Schulen.

In Deutschland existieren neben den klassischen Schulformen des dreigliedrigen Schulsystems (Hauptschule, Realschule, Gymmasium) verschiedene Formen der Gesamtschule. Zum einen die integrierte Gesamtschule, die einem integrierten Stufenaufbau folgt, also einer nicht differenzierenden Sekundarstufe I und einer angeschlossenen Oberstufe bzw. Sekundarstufe II innerhalb einer Schule. Diese Form der Gesamtschule ist es, die wie oben erwähnt in den 1970er Jahren diskutiert wurde. Zum anderen existieren auch – in der Sprache des Statistischen Bundesamts (Destatis, 2022) – Schulen mit mehreren Bildungsgängen. Dabei handelt es sich um Schulen der Sekundarstufe I mit innerer Differenzierung, in der Schüler*innen verschiedene Abschlüsse erwerben können. Es sind also Schulen, die grob beschrieben aus einer Zusammenführung von Haupt- und Realschulen gebildet wurden (in Nordrhein-Westfalen bspw. Sekundarschulen genannt) und zusammen mit dem Gymnasium eine Art Schulsystem mit zwei Wegen bilden (vgl. Hurrelmann, 2013). Heinz-Peter Meidinger bezieht sich in seinem Kapitel auf beide Arten, wobei er beide in seine negative Beurteilung der Gesamtschule einschließt. Die von ihm auch beschriebene Verlängerung der Grundschule wird als schulartunabhängige Orientierungsstufe bezeichnet und ist keine Gesamtschule im Sinne der anderen beiden Schularten.

Wie groß ist der Anteil von Gesamtschulen im deutschen Bildungssystem? Im Schuljahr 2021/2022 gab es in Deutschland insgesamt 4058 Gesamtschulen (2156 integrierte Gesamtschulen, 1902 Schularten mit mehreren Bildungsgängen) (Destatis, 2022). Bezogen auf alle allgemeinbildenden, weiterführenden Schulen entspricht das ca. 28% , wobei die meisten von ihnen in Nordrhein-Westfalen und Baden-Württemberg, die wenigsten in Bayern liegen.

Was lässt sich theoretisch erwarten?

Warum sollte man in einem eingliedrigen oder mehrgliedrigen Schulsystem eigentlich höhere Lernzuwächse im Vergleich zum jeweils anderen System erwarten? Fokussiert man sich rein auf die Entwicklung inhaltsbezogener Kompetenzen (z.B. Lesekompetenz, mathematische Kompetenz), dann werden auf theoretischer Basis grundsätzlich die folgenden Begründungsmuster für Vorteile des jeweiligen Systems formuliert.

Befürworter*innen eines Schulsystems, in dem die Schüler*innen nach der Grundschule nach ihrer Leistung bzw. (kognitiven) Leistungsfähigkeit auf verschiedene Schulformen verteilt werden, argumentieren meist dahingehend, dass eine möglichst homogene Zusammensetzung nach Fähigkeiten Vorteile für die Gestaltung des Unterrichts bietet (vgl. Hallinan, 1994). Sind diese auf einem möglichst ähnlichen Niveau, könnten Lehrkräfte ihren Unterricht einfacher und kohärenter an deren Lernvoraussetzungen anpassen und besser an die Voraussetzungen angepasster Unterricht führt zu besseren Lernzuwächsen. In einem so differenzierten System sollte es also dazu kommen, dass Schüler*innen in verschiedenen, nach Leistungsfähigkeit homogenen Schulformen insgesamt besser gefördert würden, was insgesamt zu höheren Zuwächsen führen sollte (z.B. Esser, 2016). Befürworter*innen von einem Gesamtschulsystem argumentieren demgegenüber meist dahingehend, dass sich ein gegliedertes Schulsystem auf Schüler*innen mit geringeren Fähigkeitsvoraussetzungen besonders nachteilig auswirkt, weil bspw. eine Klassenzusammensetzung nur aus Schüler*innen mit schwächeren Voraussetzungen generell effektiven Unterricht erschwert, in solchen Klassen weniger kognitiv anspruchsvoll unterrichtet wird, sodass Zuwächse geringer ausfallen, und es in solchen Klassen an Unterstützung und positiven Leistungsvorbildern von Mitschüler*innen mit besseren Voraussetzungen fehlt (vgl. Heisig & Matthewes, 2022; vgl. Pfeffer, 2015). Außerdem kann das Stigma, auf einer „schlechteren“ Schulform zu sein, das Selbstkonzept (Möller & Köller, 2004) der Schüler*innen negativ formen, was Lernprozesse ebenfalls negativ beeinflusst. Diese Effekte sollten insgesamt sogar dazu führen, dass Unterschiede zwischen den Schüler*innen zunehmen (vgl. Roller & Steinberg, 2020). Dies führe zu einer größeren Bildungsungleichheit zwischen den Schüler*innen.

Je nachdem, welcher theoretischen Argumentation man eher folgt, desto eher befürwortet man die Gestaltung eines Schulsystems mit oder ohne starker externer Differenzierung in Schulformen nach Fähigkeiten. Anzumerken ist allerdings, dass mit Gesamtschulen auch noch weitere Ziele verfolgt werden bzw. bei ihrer Einführung verfolgt wurden, als die Förderung von inhaltsbezogenen Kompetenzen. Diese wurden teilweise auch als bedeutender eingeschätzt, bspw. eine bessere Einbindung von Schüler*innen bei schulischen Belangen (im Sinne von Demokratieförderung, vgl. Klafki, 2021) oder das Ermöglichen höherer Schulabschlüsse für mehr Schüler*innen mit schwächeren sozio-ökonomischen Hintergründen im Sinne von Chancengleichheit (vgl. Wulf, 2014; Hurrelmann, 2013; Fend et al., 1976).

Aller Anfang ist schwierig…

Wie lässt sich nun die Frage klären, welche Gestaltung der Schulstruktur zu positiveren Auswirkungen führt? Dies erfordert einen empirischen Vergleich zwischen Lernverläufen von Schüler*innen in Schulen unterschiedlicher Struktur bzw. aus unterschiedlichen Systemen, und das über längere Zeiträume hinweg; alles unter Berücksichtigung des gesamten jeweiligen nationalen Kontextes. Dies ist zunächst schwierig ist, da sich in Deutschland weiterführende Schulen relativ von Beginn an zu einem dreigliedrigen System entwickelt haben (vgl. Tillmann, 2012). Gesamtschulen wurden daher in den 1970er Jahren zunächst als einzelne Versuchsschulen „geschaffen“, die parallel zum laufenden Betrieb des mehrgliedrigen Systems ihre Arbeit aufnahmen. Nun geschah dies alles schon vor meiner Geburt, sodass ich mich selbst nur auf vorliegende, schriftliche Quellen stützen kann.

Die (mögliche) Einführung dieser ersten integrierten Gesamtschulen war aber auch in den Augen der damals Beteiligten schon stark durch emotionalisierte Freund-Feind-Debatten zwischen Vertreter*innen verschiedener politischer Positionen begleitet (vgl. Mattes, 2017; Hurrelmann, 2013; vgl. Tillmann, 2012). Ebenfalls wurden für die ersten Gesamtschulen schon früh umfangreiche empirische Ergebnisse (gemessen am damaligen Stand der Technik) vorgelegt (z.B. Fend, 1982). Lukesch (1985) konstatierte aber ebenfalls schon damals: „Daß [sic!] darüber hinausgehend die parteipolitische Vermarktung dieser Ergebnisse zu einer einseitigen und bisweilen verzerrenden Karikatur ausartete, war eine weitere leidvolle Erfahrung für die solchermaßen instrumentalisierten Forscher“ (Lukesch, 1985, 525). Die Sicht von Heinz-Peter Meidinger auf diese Zeit entspricht also auch der Sicht der damaligen Protagonist*innen (vgl. Meidinger, 2021, 34ff.).

Welche Ergebnisse diese ersten Untersuchungen erbrachten, ist Gegenstand des zweiten Teils dieses Beitrags. In diesem werden auch die Ergebnisse aktueller Studien zur Frage der Differenzierung im Schulsystem berichtet. Er findet sich hier.

Literatur:

  • Chmielewski, A. K. (2014). An international comparison of achievement inequality in within-and between-school tracking systems. American Journal of Education, 120(3), 293-324. (Online)
  • Destatis (Deutsches Statistik-Informationssystem) (2022). Statistischer Bericht – Allgemeinbildende Schulen – Schuljahr 2021/2022. Statistisches Bundesamt. (Online)
  • Esser, H. (2016). Bildungssysteme und ethnische Bildungsungleichheit. In C. Diehl, C. Hunkler, & C. Kristen (Hrsg.), Ethnische Ungleichheiten im Bildungsverlauf. Mechanismen, Befunde, Debatten (S. 331-396). Springer VS. (Online)
  • European Commission/EACEA/Eurydice (2022). The structure of the European education systems 2022/2023: schematic diagrams. Eurydice Facts and Figures. Publications Office of the European Union. (Online)
  • Fend, H., Knörzer, W., Nagl, W., Specht, W., & Väth-Szusdziara, R. (1976). Gesamtschule und dreigliedriges Schulsystem. Eine Vergleichsstudie über Chancengleichheit und Durchlässigkeit. Klett Verlag.
  • Fend, H. (1982). Gesamtschule im Vergleich. Bilanz der Ergebnisse des Gesamtschulversuchs. Beltz.
  • Hallinan, M.T. (1994). Tracking: From theory to practice. Sociology of Education, 67, 79–84. (Online)
  • Heisig, J. P., & Matthewes, S. H. (2022). No Evidence that Strict Educational Tracking Improves Student Performance through Classroom Homogeneity: A Critical Reanalysis of Esser and Seuring (2020). Zeitschrift für Soziologie, 51(1), 99-111. (Online)
  • Klafki, W. (2021). Integrierte Gesamtschule – Ein notwendiger Schulversuch. In W. Klafki W. (Herausgegeben von K-H. Braun, F. Stübig, & H. Stübig), Schulreformen und Bildungspolitik in der Bundesrepublik Deutschland (S. 127-186). Springer. (Online)
  • Klieme, E., Döbert, H., van Ackeren, I., Bos, W., Klemm, K., […] & Weiß, M. (2007). Vertiefender Vergleich der Schulsysteme ausgewählter PISA-Teilnehmerstaaten: Kanada, England, Finnland, Frankreich, Niederlande, Schweden. Bundesministerium für Bildung und Forschung. (Online)
  • Mattes, M. (2017). Von der Leistungs- zur Wohlfühlschule? Die Gesamtschule als Gegenstand gesellschaftlicher Debatten und pädagogischer Wissensproduktion in der Bundesrepublik Deutschland in den 1970er und 1980er Jahren. In S., Rehm E. Glaser, B. Behm, & T. Drope (Hrsg.), Wissen machen. Beiträge zu einer Geschichte erziehungswissenschaftlichen Wissens in Deutschland zwischen 1945 und 1990. Zeitschrift für Pädagogik – 63. Beiheft (S. 187-206). Beltz Juventa. (Online)
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Möller, J. & Köller, O. (2004). Die Genese akademischer Selbstkonzepte: Effekte dimensionaler und sozialer Vergleiche. Psychologische Rundschau, 55, 19–27. (Online)
  • Pfeffer, F. T. (2015). Equality and quality in education. A comparative study of 19 countries. Social Science Research, 51, 350-368. (Online)
  • Roller, M., & Steinberg, D. (2020). The distributional effects of early school stratification-non-parametric evidence from Germany. European Economic Review, 125, 103422. (Online)
  • Sälzer, C., Prenzel, M., & Klieme, E. (2013a). Schulische Rahmenbedingungen der Kompetenzentwicklung. In M. Prenzel, C. Sälzer, E. Klieme, & O. Köller (Hrsg.), PISA 2012 – Fortschritte und Herausforderungen in Deutschland (S. 155-188). Waxmann. (Online)
  • Tillmann, K.-J. (2012). Das Sekundarschulsystem auf dem Weg in die Zweigliedrigkeit. Pädagogik, 64(5), 8-12. (Online)
  • Wulf, K. (2014). Integrierte Gesamtschule: Geschichte-Konzept-Vergleich. disserta Verlag.

Podcast: Fachgespräche Lehrerinnen- und Lehrerbildung. Forschung. Diskurs. Perspektiven

Am Puls der Forschung

Bildnachweis: (c) Tübingen School of Education

Unter Federführung der School of Education der Universität Tübingen veranstaltet eine Kooperation von Lehrerbildner*innen der Universitäten Dresden, Hannover, Münster und Tübingen im Wintersemester 2022/2023 die zweite Staffel der Online-Veranstaltungsreihe „Fachgespräche Lehrerinnen- und Lehrerbildung. Forschung. Diskurs.Perspektiven.“ Dabei werden verschiedene Fragen und Herausforderungen der Lehrkräftebildung von eingeladenen Expert*innen thematisiert und mit den Teilnehmenden diskutiert. Die Reihe richtet sich an interessierte und fachkundige Akteur*innen der Lehrkräftebildung. In der ersten Staffel ging es bspw. um Fragen der Lehrkräftegewinnung (die uns auch schon hier im Blog beschäftigt haben, z.B. in unserer Beitragsreihe zum Quereinstieg), den Einsatz von Videos in der Lehrkräftebildung oder die Ungewissheit pädagogischen Handelns.

Das besondere dieser Gesprächsreihe liegt im Format der einzelnen Termine. Nach einem zentralen Hauptvortrag werden jeweils kritische Impulse und weiterführende Gedanken durch eine*n critical friend ergänzt. Beides wird von erfahrenen und im jeweiligen Forschungsfeld etablierten Kolleg*innen gestaltet. Zum Abschluss wird aber auch bewusst eine Perspektive durch eine Person der next generation, also Forscher*innen, deren akademische Karriere eher noch am Anfang steht. Es handelt sich also insgesamt um keinen Podcast im eigentlichen Sinne: Die einzelnen Vorträge bzw. Themen wurden und werden allerdings aufgezeichnet und über den Youtube-Kanal der Tübingen School of Education (TüSE) zur Verfügung gestellt.

Der Flyer zur zweiten Staffel ist online hier zu finden. Wir weisen hier im Blog aber natürlich nicht ganz uneigennützig auf das Programm hin ;). Christoph hat nämlich die Ehre, die diesjährige Staffel mit eröffnen zu dürfen. Und zwar als Vertreter der next generation beim Thema „Herausforderungen institutionalisierter Lehrkräftebildung aus
der Perspektive der Fachdidaktiken“. Der Hauptvortrag wird gehalten von Prof. Dr. Michael Hemmer (Universität Münster, Didaktik der Geographie), critical friend ist Prof. Dr. Sabine Doff (Universität Bremen, Fremdsprachendidaktik Englisch). An dieser Stelle auch herzliche Grüße an die beiden!

Um an Veranstaltungen der Fachgespräche teilzunehmen ist eine Anmeldung notwendig (zu finden hier). Daher: eine herzliche Einladung und Empfehlung! Für einen ersten Einblick haben wir hier unten einen Beitrag aus der ersten Staffel eingebettet. Er behandelt auch insbesondere Fragen der Lehrkräftebildung, um die wir uns in unserer Nachwuchsforschungsgruppe kümmern: „Von den Basisdimensionen zu den handlungsnahen Kompetenzen“. Der Hauptvortrag ist/war von Prof. Dr. Mirjam Steffensky (Universität Hamburg, Didaktik der Chemie), critical friend ist/war Prof. Dr. Anna-Katharina Praetorius (Universität Zürich, Pädagogisch-psychologische Lehr-Lernforschung und Didaktik ) und aus der next generation Dr. Stefan Sorge (Leibniz-Institut für Pädagogik der Naturwissenschaften und Mathematik Kiel, Didaktik der Physik). Auch an euch sehr herzliche Grüße!


Quellennachweis: Tübingen School of Education

Podcast: „Inside Empirische Bildungsforschung“

Back in 2021

Bildnachweis: (c) GEBF

Im Rahmen der digitalen Jahrestagung der Gesellschaft für Empirische Bildungsforschung (GEBF) 2021, von der wir auch schon im Blog berichtet hatten (hier und hier) wurde am 29.10.2021 auch ein virtueller Tag der offenen Türen unter dem Motto „Inside Empirische Bildungsforschung“ veranstaltet.

Im Rahmen dieses Tages haben viele Institute an verschiedenen deutschsprachigen Universitäten ihre Lehr- und Forschungsaktivitäten für eine interessierte Öffentlichkeit vorgestellt. Entsprechende Vorstellungsvideos finden sich auf dem YouTube-Kanal zur DigiGEBF2021 (und auch viele Videos einzelner Vorträge, von denen einige in Zukunft hier auch noch im Blog auftauchen werden ;)).

Im Rahmen des Tages hielt Prof. Dr. Manfred Prenzel einen Vortrag, in der er einen großen Überblick über Themen, Ziele und Geschichte der empirischen Bildungsforschung in Deutschland gibt. Auch wenn Fragen der Lehrerbildung eher am Rande vorkamen, ist der Vortrag doch für alle lohnenswert, die einen tieferen Einblick erhalten möchten, womit sich Leute wie wir so beschäftigen. Also: jetzt in den Sommermonaten ein kaltes Getränk holen, den Liegestuhl in WLAN-Reichweite stellen und sich entspannt weiterbilden ;).

Vortrag:

  • Prenzel, M. (2022). Empirische Bildungsforschung: Gestern, heute und (vielleicht) morgen. Keynote-Vortrag im digitalen Konferenzjahr der Gesellschaft für Empirische Bildungsforschung (GEBF) (online), 29.10.2021.

Meidingers 10 Todsünden der Schulpolitik im Licht der Bildungsforschung 2/12

Todsünde Nr. 1: Überforderung von Schule und Lehrkräften

In einer kleinen Artikelreihe beschäftigen wir uns mit dem Buch „Die 10 Todsünden der Schulpolitik – Eine Streitschrift“ von Heinz-Peter Meidinger (2021) aus der Perspektive der empirischen Bildungsforschung. Es geht uns dabei nicht um eine Rezension des Buches, sondern darum, zu schauen, wie Prämissen und Argumentationen vor dem Hintergrund von Ergebnissen der Bildungsforschung eingeschätzt werden können. Nachdem wir im ersten Beitrag Autor und Werk kurz vorgestellt und uns genauer mit der Einleitung beschäftigt haben, wenden wir uns in diesem Beitrag der ersten von zehn Todsünden der Schulpolitik zu; also, Todsünden aus Sicht des Autoren. Um den weiteren Ausführungen folgen zu können, sollte man natürlich das Buch kennen und gelesen haben. Ich möchte daher an dieser Stelle noch einmal ausdrücklich eine Leseempfehlung aussprechen, auch, wenn man die Ansichten des Autors nicht immer teilt. Zu Beginn noch einmal der Hinweis: Im Folgenden formuliere ich viel im Konjunktiv. Das soll keine Zustimmung oder Ablehnung zu Thesen signalisieren, sondern folgt einfach den Regelungen zur indirekten Rede.

Ziele von Schule – Zu viele oder gerade richtig.?

Im Kapitel zur Todsünde Nr. 1 wird – grob zusammengefasst – dahingehend argumentiert, dass die Schule bzw. die tätigen Lehrkräfte zu viele Aufgaben bzw. Ziele verfolgen würden bzw. sollen. Dies wiederum führe zum einen dazu, dass nicht alle Ziele gleichermaßen erreicht werden können und zum anderen dazu, dass Lehrkräfte stark belastet werden, mit Folgen für die Gesundheit. Als Kernaufgaben der Schule werden „Unterricht, Wissens-, Kompetenz- und Wertevermittlung“ (Meidinger, 2021, 26) genannt, denen exemplarisch zehn weitere Zielerwartungen neben- bzw. gegenübergestellt werden. Darunter eher gesamtgesellschaftliche Zielerwartungen (z.B. Inklusion, Integration), aber auch konkretisierte Ziele eher auf Individualebene (z.B. Medienerziehung, Berufs- und Studienorientierung). Die Gegenüberstellung zu den definierten Kernaufgaben wird dabei leider nicht näher erläutert. Bspw. hat Schule natürlich auch eine Erziehungsfunktion und das Ziel „die Demokratie stärken“ (Meidinger, 2021, 26) kann auch als Teil der Wertevermittlung verstanden werden. Viele dieser genannten Ziele sind in allen Kernlehrplänen der Bundesländer verankert (einige auch schon sehr lange), häufig in den allgemeineren Teilen. Insgesamt wird bzgl. schulischer Ziele aber eine Überfrachtung konstatiert, die im weltweiten Vergleich in Deutschland einzigartig hoch sei. Sie werde insbesondere von zwei Akteur*innen an die Schule herangetragen: Bildungspolitiker*innen und Vertreter*innen der wissenschaftlichen Pädagogik. Gerade Letzteren wird polemisch – es ist ja auch eine Streitschrift – ein „Allmachtswahn“ (Meidinger, 2021, 28) als Motiv zugeordnet, der sich darin ausdrücke, neue Lehrkonzepte zu formulieren, die in der Realität nicht umsetzbar seien. Die empirisch ausgerichtete Erziehungswissenschaft hingegen könne die Umsetzbarkeit und Wirkung von Konzepten prüfen. Diese letzte Aussage ist eine Einschätzung, die ich natürlich teile (schon weil ich selbst in diesem Berufsfeld tätig bin ;)).

Grenzen der Individualisierung?

Als Beispiel für eine solche (positive) empirische Betrachtung von Bedingungen des Lernens, wird aus einer Studie – nach Autorenaussage zur Veränderbarkeit von Lernmotivation aufgrund genetischer Prägung – zitiert, in der geschlussfolgert werden würde, dass Schüler*innen aufgrund individueller Begabungen nicht zu gleichen Leistungen befähigt werden können.

„Schüler sind mit individuellen Begabungen ausgestattet, und es wird nicht möglich sein, sie durch Fördermaßnahmen auf breiter Basis zu gleichen Leistungen zu befähigen.“

(Spinath, Spinath & Borkenau, 2008, 114)

Leider ist im Text keine Quellenangabe zum Zitat enthalten. Die Möglichkeiten der Onlinesuche führen zu Spinath et al. (2008), einem Kapitel im als Lehrbuch angelegten Handbuch der Pädagogischen Psychologie. Um diese Aussage etwas genauer einordnen zu können, lohnt ein Blick in das gesamte Kapitel, aus dem das Zitat stammt. Dort werden Forschungen von sozialen und genetischen Determinanten zur Lernfähigkeit von Schüler*innen zusammengefasst. In solchen verhaltensgenetischen Studien wird analysiert, zu welchen Anteilen Unterschiede in der oben beschriebenen Lernfähigkeit von Menschen durch genetische (also feste Anlagen einer Person) oder soziale (also Erfahrungen und Einflüsse des Umfelds) Einflussfaktoren erklärt werden können. Methodisch werden Zwillings- oder Adoptionsstudien durchgeführt, bei der unter verschiedenen Annahmen genetische und soziale Einflüsse kontrolliert werden können. Dabei fassen Spinath et al. (2008) den Einfluss genetischer Determinanten aus Studien auf die allgemeine kognitive Fähigkeit mit ca. 50% zusammen. Die soziale Umwelt hat also einen vergleichbaren Einfluss. Die Bedeutung genetischer Determinanten nimmt über die Lebensspanne allerdings zu. Wichtig ist: mit solchen Anteilen von Varianzkomponenten können Aussagen über Unterschiede zwischen Personen gemacht werden, nicht über Fähigkeiten einer einzelnen Person. Zugleich sind diese Anteile nicht konstant. Spinath et al. (2008) nennen die Körpergröße als Beispiel, die stark genetisch bestimmt ist: „Obwohl die Körpergröße innerhalb einer Kohorte hochgradig genetisch determiniert ist, wurden die Menschen unter sich verbessernden Umweltbedingungen immer größer.“ (Spinath et al.,2008, 113), wobei irgendwann aufgrund der beschränkten Verbesserbarkeit der Umweltbedingungen eine bisher unbekannte Grenze vermutet werden kann. „Analog dazu gilt für die Lernfähigkeit, dass derzeit keine Aussagen darüber möglich sind, wo die Grenzen der Verbesserung durch geeignete Interventionen liegen.“ (Spinath et al.,2008, 113)

Im Kontext des Textes wird dieser Bezug zur Wissenschaft hergestellt, um „die eigenen Möglichkeiten realistisch einzuschätzen“ (Meidinger, 2021, 29), wobei nicht ganz deutlich wird, ob dies eher bezogen auf erzieherische oder lernunterstützende Tätigkeiten gemeint ist. Das obige Zitat wird weitergeführt mit: „Stattdessen gilt es, die vorhandenen Stärken durch individuell angemessene Maßnahmen so zu fördern, dass es allen Schüler möglich wird, ihre Potenziale bestmöglich auszuschöpfen. Ziel von schulischen […] Lernprozessen sollte demnach nicht die Egalisierung des Leistungsniveaus sein, sondern das Hervorbringen von durchaus unterschiedlichen Leistungen auf möglichst hohem Niveau“ (Spinath et al., 2008, 114). Diese individuell angemessenen Verfahren können sich natürlich auf unterschiedliche Kontexte beziehen (z.B. Maßnahmen im Unterricht, Maßnahmen auf Ebene des Schulsystems). Aus Verhaltensgenetischen Studien ergibt sich also nicht direkt eine bevorzugte Handlungsweise, sondern dort sind viele normative Entscheidungen zu treffen.

Welcher Schluss aus diesem Forschungsbeitrag für die Argumentation im Rahmen der Streitschrift gezogen werden soll, bleibt ein wenig unklar. Interpretieren lässt es sich als ein Argument gegen die Forderung eines gemeinsamen Unterrichts von Schüler*innen sehr unterschiedlicher Lernvoraussetzungen, als Gegenposition zum vorher benannten „Allmachtswahn“ von Pädagog*innen. Dies ist allerdings eine Interpretation meinerseits und wird im Text nicht explizit formuliert. Die Quelle bezieht sich jedenfalls weniger auf (eher affektive) Lernmotivation, sondern auf (kognitive) Lernfähigkeit.

Arbeitszeit von Lehrkräften

Als weiteres und das für die im Kapitel thematisierte Todsünde eigentlich bestimmende Beispiel empirischer Bildungsforschung wird im Beitrag auf die Arbeitsbelastung bzw. genauer die Arbeitszeit von Lehrkräften im deutschen Bildungssystem Bezug genommen. Wir fokussieren für diesen Blogbeitrag auch auf die Arbeitszeit, weil im Text zugleich angemerkt wird, dass gerade die Arbeitszeit von Lehrkräften von Seiten der Landesregierungen in Deutschland bisher nicht angemessen untersucht werde, weshalb dies von Lehrerverbänden angestoßen werden müsse. Ein aktuelles Beispiel sei die vom deutschen Philologenverband initiierte LaiW-Studie (Lehrerarbeit im Wandel), die wir später noch genauer betrachten werden.

Die Arbeitszeit von Lehrkräften und auch ihr Belastungserleben wurden schon häufiger empirisch untersucht. Schaarschmidt et al. (2007) berichten bspw. basierend auf Wochenstundenangaben von N = 4181 Lehrkräften verschiedener Schulformen aus Nordrhein-Westfalen eine durchschnittliche Gesamtarbeitszeit von 62,2 Stunden für Vollzeitlehrkräfte und 49,5 Stunden für Teilzeitlehrkräfte. Hardwig & Mußmann (2018) fassen umfangreich Zeiterfassungsstudien zusammen, die zwischen 1958 und 2016 in Deutschland durchgeführt wurden. Zugleich existieren auch aktuellere Ergebnisse aus dem Raum Frankfurt (Mußmann et al., 2020). Grob zusammengefasst, stellten alle diese Untersuchungen fest, dass Lehrkräfte im Mittel mehr Arbeitszeit aufwenden, als es gemäß ihrer Dienstaufgaben bzw. vertraglichen Situation vorgesehen ist, wobei natürlich Abweichungen zwischen einzelnen Untersuchungen und Gruppen von Lehrkräften bestehen.

Die LaiW-Studie ist aber insofern bemerkenswert, als bundesweit vergleichend Daten von insgesamt ca. N = 16.000 erhoben wurden (von Januar 2018 bis Mai 2018) und die Erfassung von Arbeitszeitdaten methodisch relativ präzise erfolgte. Dabei wurden zwei Erfassungsmethoden kombiniert, ein Onlinefragebogen zur Einschätzung der Gesamtarbeitszeit einer Woche (viermal) und ein tägliches Protokoll der Arbeitszeit nach vordefinierten Tätigkeiten über einen Zeitraum von vier Wochen (Kreuzfeld, Felsing & Seibt, 2022). Methodisch interessant ist ebenfalls, dass daneben auch eine app-basierte Erfassung erprobt wurde (Felsing et al., 2019). Für Vollzeitlehrkräfte ergab sich eine durchschnittliche Wochengesamtarbeitszeit von 45.2 Stunden, für Teilzeitlehrkräfte von 36,5 Stunden (für eine bereinigte Stichprobe von N = 6109; Kreuzfeld, Felsing & Seibt, 2022; DPhV, 2020). Die Daten beziehen sich, gemäß dem beauftragenden Verband, allerdings nur auf Gymnasiallehrkräfte.

Wichtig ist zu allen diesen Studien anzumerken, dass innerhalb der Gruppe der Lehrkräfte ebenfalls große Unterschiede existieren (in der LaiW-Studie gaben bspw. 45% der Befragten wöchentliche Arbeitszeiten von über 45 Stunden an, DPhV, 2020). Diese Arbeitszeiten sind im weltweiten Vergleich allerdings nicht unbedingt herausragend hoch. Für die Schweiz ergeben sich bspw. ähnliche durchschnittliche Gesamtwochenarbeitszeiten (Brägger & Schwendimann, 2022), in England etwas höhere (Walker et al., 2019). Hohe Arbeitszeiten gehen mit hohem Belastungserleben einher, welches in vielen der erwähnten Studien ebenfalls erhoben wurde. Es lohnt sich daher, auf diese einen näheren Blick zu werfen. Aus Gründen des Umfangs können wir die Ergebnisse hierzu allerdings nicht umfassend beschreiben, auch weil die Anzahl entsprechender Untersuchungen größer ist als vergleichbare Arbeitszeituntersuchungen (siehe z.B. Rothland, 2007).

Fazit

Was lässt sich hieraus nun bzgl. der Thesen aus dem Buch schließen? Insgesamt ist es empirisch gut belegt, dass Lehrkräfte in Deutschland häufig höhere wöchentliche Gesamtzeiten arbeiten, als vorgesehen, was zu hohen Belastungen führt. Insofern ist diese Prämisse für die formulierte Todsünde Nr. 1 der Überlastung von Lehrkräften auch empirisch gut fundiert und es stimmt, dass diese Untersuchungen fast nur von Lehrerverbänden angestoßen wurden. Die Aussage der zu großen Anzahl unterschiedlicher Zielerwartungen und -vorgaben an Lehrkräfte bzw. an die Schule ist aus der Perspektive der empirischen Bildungsforschung schwierig zu betrachten, da diese These im Text wenig mit Bezug zu empirischen Aussagen formuliert wird (es bleibt eher eine normative Einschätzung). Auch aus dem impliziten Bezug zu verhaltensgenetischen Studien wird keine konkretere Aussage abgeleitet. Die zweite Todsünde wird Gegenstand des nächsten Beitrags in dieser Artikelreihe sein. Er findet sich hier.

Literatur:

  • Brägger, M., & Schwendimann, B. A. (2022). Entwicklung der Arbeitszeitbelastung von Lehrpersonen in der Deutschschweiz in den letzten 10 Jahren. Prävention und Gesundheitsförderung17(1), 13-26. (Online)
  • Deutscher Philologenverband (Hrsg.) (2020). Arbeitsbelastung, Zufriedenheit und Gesundheit von Lehrkräften an Gymnasien. Presse-Konferenz in Berlin, 09.03.2020. (Online)
  • Felsing, C., Kreuzfeld, S., Stoll, R., & Seibt, R. (2019). App-basierte vs. geschätzte Ermittlung der Arbeitszeit von Gymnasiallehrkräften. Prävention und Gesundheitsförderung14(3), 281-289. (Online)
  • Hardwig, T., & Mußmann, F. (2018). Zeiterfassungsstudien zur Arbeitszeit von Lehrkräften in Deutschland. Konzepte, Methoden und Ergebnisse von Studien zu Arbeitszeiten und Arbeitsverteilung im historischen Vergleich. Expertise im Auftrag der Max-Träger-Stiftung. Georg-August-Universität Göttingen. (Online)
  • Kreuzfeld, S., Felsing, C., & Seibt, R. (2022). Teachers’ working time as a risk factor for their mental health-findings from a cross-sectional study at German upper-level secondary schools. BMC public health22(1), 1-12. (Online)
  • Meidinger, H.-P. (2021). Die 10 Todsünden der Schulpolitik – Eine Streitschrift. Claudius Verlag.
  • Mußmann, F., Hardwig, T., Riethmüller, M.m Klötzer, S., & Peters, S. (2020). Arbeitszeit und Arbeitsbelastung von Lehrkräften an Frankfurter Schulen 2020. Georg-August-Universität Göttingen. (Online)
  • Rothland, M. (2007). Belastung und Beanspruchung im Lehrerberuf. Springer VS. (Online)
  • Schaarschmidt, U., Fischer, A., Sieland, B., Rahm, T., & Tarnowski, T. (2007). Die Arbeitszeit der Lehrerinnen und Lehrer in Nordrhein-Westfalen – Ergebnisse und Vorschläge der Projektgruppe QuAGiS zur Entwicklung eines zukunftsfähigen Arbeitszeitmodells. Projektgruppe QuAGiS (Qualität, Arbeit und Gesundheit in Schulen) des VBE NRW. (Online)
  • Spinath, F. M., Spinath, B., & Borkenau, P. (2008). Soziale und genetische Determinanten der Lernfähigkeit. In W. Schneider, & M. Hasselhorn (Hrsg.), Handbuch der Pädagogischen Psychologie (S. 105-115). Hogrefe.
  • Walker, M., Worth, J., & Van den Brande, J. (2019). Teacher workload survey 2019. Research Brief. Department of Education. (Online)