Fragestellungen der Studie:

  • Welche Lernzuwächse zeigen sich bei Schülerinnen und Schülern aus Deutschland, Finnland und der Schweiz nach einer Unterrichtseinheit zur elektrischen Energie?
  • Inwiefern unterscheiden sich im Fach Physik das Interesse und Selbstkonzept von Schülerinnen und Schülern aus Deutschland, Finnland und der Schweiz?
  • Welche Zusammenhänge bestehen im Fach Physik zwischen Inhaltswissen, Interesse und Selbstkonzept von Schülerinnen und Schülern aus Deutschland, Finnland und der Schweiz?

Rezension zur Studie

Uncovering Country Differences in Physics Content Knowledge and their Interrelations with Motivational Outcomes in a Latent Change Analysis

Spoden, C. & Geller, C. (2014)

Im Rahmen des QuIP-Projekts, einer sorgfältig und aufwendig angelegten vergleichenden Untersuchung zur Qualität des Physikunterrichts in Deutschland (NRW), Finnland und der Schweiz, wurden in einem Teilprojekt Lernzuwächse des Inhaltswissens von Schülerinnen und Schülern der neunten und zehnten Jahrgangsstufe sowie Veränderungen ihres Interesses und des Zutrauens in die eigene Leistungsfähigkeit (Selbstkonzept) nach einer Unterrichtssequenz zum Themenbereich ‚Elektrische Energie und Leistung‘ ermittelt.

Ausgehend von einem überdurchschnittlichen Vorwissen der Schülerinnen und Schüler in Deutschland zeigen sich in Finnland beträchtliche, in der Schweiz deutliche, in Deutschland jedoch nur geringe durchschnittliche Lernzuwächse, sodass die Schülerinnen und Schüler aus Finnland am Ende über das größte Inhaltswissen verfügen. Das mittlere Interesse liegt in Deutschland zu Beginn unterhalb der Werte in Finnland und der Schweiz, steigt im Verlauf der Unterrichtssequenz allerdings geringfügig, wohingegen es in der Schweiz, ebenso wie das Selbstkonzept, abnimmt. Interesse und Selbstkonzept hängen eng zusammen, ihre Veränderungen verlaufen jeweils tendenziell ähnlich und sie sind hochsignifikant mit dem Vorwissen korreliert. Überraschend mit Blick auf die mittleren Lernzuwächse und die durchschnittlichen Testergebnisse am Ende der Unterrichtssequenz sind die im Mittel hohen Ausprägungen des Selbstkonzepts für den deutschen Teil der Stichprobe.

In Zusammenschau u. a. mit den Ergebnissen des Teilprojekts der QuIP-Studie zur Sichtstruktur des Unterrichts (Beerenwinkel & Börlin, 2014) ergeben sich damit Anhaltspunkte für mögliche Schwächen des Physikunterrichts in Nordrhein-Westfalen, wenngleich die Ergebnisse möglicherweise nicht repräsentativ sind. Die Untersuchung nimmt zwar einen bestimmten Themenbereich in den Blick und nur das Inhaltswissen wird erfasst, jedoch sind zentrale fachliche Inhalte betroffen und Fachwissen ist als wesentliche Grundlage für Leistungen in anderen Kompetenzbereichen anzusehen.

In der so genannten QuIP-Studie (Quality of Instruction in Physics) wird Physikunterricht in Deutschland (Nordrhein-Westfalen), Finnland und der deutschsprachigen Schweiz vergleichend untersucht. Ausgangspunkt ist ein weit gefasstes theoretisches Modell zu Faktoren der Unterrichtsqualität, in dem die Bereiche Lehrereigenschaften, Schülereigenschaften, Unterricht und Lernergebnisse Berücksichtigung finden. Ziel der Studie ist es, länderspezifische typische Muster des Physikunterrichts zu identifizieren, mit denen sich die unterschiedlichen Ergebnisse bei internationalen Vergleichsstudien wie TIMSS und PISA erklären lassen. Um den Unterricht vergleichen zu können, wird eine eingegrenzte Thematik (Elektrische Energie und Leistung) in den Blick genommen, die in allen drei Ländern etwa in der gleichen Altersstufe unterrichtet wird.

In einem Teilprojekt der QuIP-Studie untersuchen Spoden und Geller Lernzuwächse im Inhaltswissen sowie motivationale Variablen wie Interesse und Selbstkonzept und deren Veränderungen im Laufe der einheitlichen Unterrichtssequenz. Zugrunde gelegt wird die Annahme, dass Lernzuwächse sowie die Ausprägungen motivationaler Merkmale in einem positiven Zusammenhang mit der Unterrichtsqualität stehen.

Spoden und Geller heben hervor, dass im Unterschied zu den PISA-Studien, bei denen Anteile verschiedener Fächer, unterschiedlicher Themen und unterschiedlicher Lernzeiten aggregiert werden, die inhaltliche Vergleichbarkeit bessere Chancen für eine tiefere Analyse von Unterschieden in den drei Ländern bietet. Anders als die PISA-Untersuchung ermöglicht die QuIP-Studie, in einem präzise beschriebenen und eingegrenzten Themenbereich Unterrichtsergebnisse in einen Zusammenhang mit bestimmten Merkmalen des Unterrichts zu bringen. Um auszuschließen, dass Veränderungen hauptsächlich auf individuelle Hintergrundvariablen wie den sozioökonomischen Status zurückzuführen sind, wurden derartige Variablen miterhoben und berücksichtigt.

Als Voraussetzungen und Ergebnisse des Unterrichts werden das Inhaltswissen, das Interesse und das Selbstkonzept der Lernenden in den Blick genommen. Spoden und Geller argumentieren unter Bezug auf die bisherigen PISA-Studien, dass der finnische Unterricht in den Naturwissenschaften zu deutlich besseren Lernleistungen führe als in Deutschland oder der Schweiz. Die Ursachen dafür seien unklar. Außerdem hingen in den anderen Ländern die Lernleistungen weniger mit sozioökonomischen Bedingungen zusammen als etwa in Deutschland. Bezüglich des Interesses an Physik wird auf zahlreiche Untersuchungen verwiesen, nach denen das Fach Physik generell wenig beliebt ist, wobei allerdings vorhandenes Interesse und Lernzuwächse der Schülerinnen und Schüler einen deutlichen Zusammenhang zeigen. In PISA 2006 wurde jedoch auch ein abweichender Befund berichtet, nach dem in Deutschland ein relativ großer Anteil von Schülerinnen und Schülern mit hohen Testergebnissen ein geringes Interesse am Fach bekundeten. In Finnland war dieser Anteil beträchtlich kleiner.

Das Selbstkonzept schließlich misst, wie Schülerinnen und Schüler ihre fachliche Leistungsfähigkeit selbst einschätzen. Auf der Grundlage verschiedener Untersuchungen wird erwartet, dass das Selbstkonzept in einem positiven Zusammenhang mit Lernergebnissen steht.

Folgende Forschungsfragen werden von Spoden und Geller formuliert:

  • Finden sich Länderunterschiede, die sich früher bei internationalen Large-Scale-Assessments zeigten, ebenfalls bei der vorliegenden Untersuchung im Pre-Post-Design mit einer thematischen Einschränkung auf den Bereich der elektrischen Energie? Zeigen also Schülerinnen und Schüler in Finnland bessere Lernergebnisse als in Deutschland und der Schweiz?
  • Gibt es Unterschiede in den drei Ländern bezüglich motivationaler Merkmale? Zeigen also finnische Schülerinnen und Schüler bei insgesamt besseren Lernergebnissen ein größeres Interesse als Schülerinnen und Schüler aus Deutschland oder der Schweiz?
  • Wie stark sind jeweils Zuwächse im Inhaltswissen und Veränderungen bei Interesse und Selbstkonzept miteinander korreliert?

Aus den beteiligten Ländern bearbeiteten 2.135 Schülerinnen und Schüler in 103 Schulklassen der Jahrgangsstufen 9 bzw. 10 (Deutschland 47, Finnland 25, Schweiz 31) vor der Unterrichtsreihe und nach deren Abschluss zur Erhebung ihres Inhaltswissens einen Test im Bereich elektrische Energie. Der Test wurde nach einer Analyse der Curricula durch Fachdidaktiker der drei Länder entwickelt. Er besteht aus 54 Aufgaben (40 Multiple-Choice-Items und 14 Items mit offenem Antwortformat), die in Anlehnung an das Konstruktionsmodell der Aufgaben für den IQB-Ländervergleich 2012 zur Überprüfung der Bildungsstandards in Deutschland erstellt wurden. Die Aufgaben wurden einer Analyse gemäß dem Rasch-Modell unterzogen, die jede Aufgabe von ihrer Schwierigkeit her einem bestimmten Fähigkeitsniveau zuordnet. Auf dieser Grundlage wurden die Aufgaben auf drei Testhefte aufgeteilt (Multi-Matrix-Design). In der Voruntersuchung bearbeiteten die Testpersonen ein Heft mit 18 Aufgaben, im Abschlusstest dann die restlichen beiden Hefte mit 36 Aufgaben.

Für die Messung von Selbstkonzept und Interesse wurden zu beiden Messzeitpunkten bewährte Fragebögen eingesetzt, die bei PISA 2006 zur Anwendung kamen. Daneben wurden im Vortest Hintergrundvariablen wie kognitive Fähigkeiten und sozioökonomische Bedingungen (Zuwanderungshintergrund, Ausbildung der Eltern, Schullaufbahn) erhoben.

Zur Auswertung der Daten wurde ein Strukturgleichungsmodell mit einer Latent-Change-Analyse eingesetzt, weil damit der Einfluss der einzelnen Variablen und Effektstärken zwischen den beiden Messzeitpunkten zuverlässiger einzuschätzen seien.

Beim Vorwissen starten Schülerinnen und Schüler in Deutschland von einem höheren Ausgangsniveau als in Finnland und insbesondere der Schweiz, was sich über vorherigen Unterricht zur Elektrizität aufgrund des deutschen Spiralcurriculums erklären lässt. Lernzuwächse sind in den deutschen Klassen nur marginal, in der Schweiz im Vergleich signifikant höher (β = 0.19, p < .05) und in Finnland beträchtlich (β = 0.25, p < .001).

Die Analyse der Kovariaten ergibt keine bedeutsamen Zusammenhänge der kognitiven Fähigkeiten, des Zuwanderungshintergrunds und der sozioökonomischen Bedingungen mit den Länderwerten zum Fachwissen.

Das Selbstkonzept finnischer Schülerinnen und Schüler liegt im Vortest signifikant (β = -0.12, p < .01) unter dem der Lernenden in der Schweiz und in Deutschland, das Interesse ist in Finnland hingegen etwas größer als in Deutschland. In diesen beiden Ländern ändern sich Interesse und Selbstkonzept nur wenig, anders als in der Schweiz, wo beide Größen im Verlauf der Unterrichtssequenz signifikant abnehmen.

Auf der individuellen Ebene zeigen sich starke Korrelationen zwischen Selbstkonzept und Interesse (r = .69, p < .001) beide sind hochsignifikant mit dem Vorwissen korreliert (r = .34 bzw. r = .32, p < .001) Deutliche Korrelationen (r = .45, p <.001) bestehen zwischen Veränderungen von Selbstkonzept und Interesse, allerdings werden keine Zusammenhänge mit Lernzuwächsen sichtbar.

Hintergrund: Large-Scale-Assessments liefern aussagefähige Momentaufnahmen zu Lernergebnissen, sie zeigen aber kaum Handlungsperspektiven zur Qualitätssteigerung des Unterrichts auf. Solche Perspektiven sind jedoch erforderlich, um Konsequenzen aus Leistungsvergleichen ziehen zu können. Dass hier ein erheblicher Bedarf besteht, lässt sich u. a. an der Aufmerksamkeit erkennen, die die Hattie-Metaanalyse (Hattie, 2008, 2011) zu Faktoren der Unterrichtsqualität erhalten hat.

Es ist naheliegend, für mögliche Verbesserungsmaßnahmen des Unterrichts danach zu suchen, was erfolgreiche Länder anders machen. Die QuIP-Studie geht diese Suche deutlich konsequenter an als vorherige Bemühungen. Ausgangspunkt ist ein theoretisches Modell der Unterrichtsqualität, dessen Faktoren in den Vergleichsländern einerseits differenziert, andererseits in ihren Zusammenhängen empirisch untersucht werden. Einer dieser Faktoren, das Ergebnis des Unterrichts und insbesondere der Lernzuwachs, wird von Spoden und Geller untersucht.

Design: Die Konstruktion der Testinstrumente sowie die Auswertung der Daten erfolgte nach Standards, die dem Stand guter empirischer Forschung entsprechen. Es wurden für die Erhebung der Daten zu den motivationalen Merkmalen Fragebögen verwendet, die sich auch in anderen Untersuchungen schon bewährt haben. Die Aufgabenkonstruktion für die Leistungstests erfolgte nach ähnlichen Prinzipien wie für den IQB-Ländervergleich 2012 zur Überprüfung der Bildungsstandards. Die Validität der Testergebnisse dürfte durch die spezielle Auswahl der Thematik, die in den drei beteiligten Ländern sehr ähnlich ist, gewährleistet sein. Insgesamt erscheinen die Ergebnisse für den eingegrenzten Bereich der Untersuchung als zuverlässig. Mit Blick auf die Größe der Stichprobe und den untersuchten Inhaltsbereich stellt sich zwar die Frage, als wie repräsentativ und verallgemeinerbar die Ergebnisse angesehen werden können. Trotzdem liefert die Studie recht klare Aussagen zu möglichen Schwächen des Physikunterrichts in Nordrhein-Westfalen, die als Ausgangspunkte für weitere Untersuchungen und für Maßnahmen zur Qualitätsverbesserung dienen können.

Ergebnisse: Man hat sich bereits daran gewöhnt, dass sich der deutsche naturwissenschaftliche Unterricht in seinen Ergebnissen an den Lernergebnissen insbesondere von Finnland misst. Auch die QuIP-Studie stellt diesen Vergleich in den Vordergrund. Anders jedoch als in den Large-Scale-Assessments PISA und TIMSS, bei denen Inhalte überprüft werden, die sich über mehrere Fächer und mehrere Jahrgangsstufen erstrecken, wird in dieser Studie gezeigt, dass Leistungsunterschiede auch sichtbar werden, wenn es um gleiche fachliche Inhalte geht, die im gleichen Alter unterrichtet werden. Es bleibt damit allerdings offen, ob die Ergebnisse und Schlussfolgerungen daraus auch für andere Inhaltsbereiche des Fachs verallgemeinert werden können.

Betrachtet man die vorliegenden Ergebnisse, ist besonders auffällig, dass die deutschen Klassen im Mittel nach immerhin etwa einem halben Jahr Unterricht anders als in der Schweiz und vor allem in Finnland selbst bei einer etwas besseren Ausgangslage nur marginale Lernzuwächse zeigen. Diese Problematik wirft Fragen auf, die sich weder mit Hinweisen auf die Besonderheit der Thematik noch auf Unterschiede in kulturellen Hintergründen (wie es gelegentlich mit Bezug auf asiatische Länder geschieht) beantworten lassen. Es erscheint zwingend, nach Ursachen für die geringe Effizienz des Physikunterrichts zu suchen.

Spoden und Geller sehen in den Ergebnissen deutliche Hinweise darauf, dass die schlechteren Testresultate bei den deutschen und auch bei den schweizerischen Schülerinnen und Schülern beim zweiten Messzeitpunkt auf ein grundsätzlich unzureichendes Verstehen physikalischer Inhalte zurückzuführen sind, und dass es sich nicht nur um besondere Probleme beim Transfer oder bei der praktischen Anwendung von Wissen auf andere Kontexte handelt. Bezüglich des geringen Lernzuwachses bei den Schülerinnen und Schülern aus Deutschland verweisen sie auf vergleichbare Befunde in einer nationalen Ergänzungsstudie im Anschluss an PISA 2003. Danach waren bei nur 50 % der Lernenden zwischen der 9. und der 10. Klasse signifikante Zuwächse im naturwissenschaftlichen Wissen zu erkennen, bei ungefähr 20 % zeigten sich sogar Wissensrückschritte. Sie fordern, dass Untersuchungen zur Unterrichtsqualität im Physikunterricht mit hoher Priorität versuchen müssten, Ursachen für derartige Defizite aufzuklären.

Es gibt keine Gründe für die Annahme, dass individuelle Eigenschaften von Lehrpersonen und Lernenden dabei ausschlaggebend sind. Auch ansonsten zweifellos bedeutsame Randbedingungen wie verfügbare Stundendeputate etc. sind hier nicht verantwortlich zu machen. Es drängt sich vielmehr die Frage auf, ob sich Vorstellungen zum Physikunterricht und damit verbundene Unterrichtsskripts in Nordrhein-Westfalen in eine wenig erfolgversprechende Richtung entwickelt haben. Es ist zu klären, was in dem betrachteten Unterricht, der ja ein nicht unerhebliches Zeitintervall beansprucht, eigentlich geschieht und was dessen Effizienz beeinträchtigt. Erste Antworten sind in den Ergebnissen anderer Teilprojekte der QuIP-Studie zur Sichtstruktur und zur Tiefenstruktur des Physikunterrichts zu suchen.

Bezüglich der weiteren Forschungsfragen bezeichnen es Spoden und Geller als bemerkenswert, dass motivationale Merkmale in Deutschland stärker ausgeprägt sind als in Finnland, sie weisen für dortige Schülerinnen und Schüler insbesondere auf niedrigere Werte im Selbstkonzept hin. Sie vermuten, wohl auch mit Blick auf andere Untersuchungen der QuIP-Studie, Zusammenhänge zu bestimmten Unterrichtsmustern, die häufiger in Deutschland und der Schweiz zu finden sind (vgl. Beerenwinkel & Börlin, 2014). Hier stehen motivierende handlungsorientierte Aktivitäten im Vordergrund, welche jedoch nicht zu einem tieferen fachlichen Verständnis führen oder es möglicherweise sogar behindern. Die beiden motivationalen Merkmale Interesse und Selbstkonzept sind stark miteinander korreliert und zeigen auch einen Zusammenhang mit dem bestehenden Inhaltswissen der Lernenden. Veränderungen dieser Merkmale im Unterrichtsverlauf sind gering. Wohl auch aufgrund des Alters und der bestehenden Erfahrungen mit dem Unterrichtsfach Physik seien Interesse und Selbstkonzept relativ stabil.

Erwartungswidrig erscheint für den Unterricht in Deutschland der entkoppelte Zusammenhang zwischen Selbstkonzept und Lernleistungen der Klassen, da diese beiden Größen normalerweise korreliert sind. Es ist anzunehmen, dass sich Selbstkonzepte in einem Lernbereich aufgrund der Verarbeitung von Feedback seitens Lehrpersonen, Eltern, Klassenkameraden usw. sowie aus eigenen Kompetenzerfahrungen entwickeln. Die allgemein recht hohen und in ihrer Bandbreite vergleichsweise wenig differenzierenden Selbstkonzeptwerte bei den Lernenden in Deutschland könnten darauf hinweisen, dass die kognitiven Anforderungen im Physikunterricht eher wenig herausfordernd sind (es wäre zu überlegen, warum das Fach trotzdem als schwer angesehen wird; siehe dazu auch das Teilprojekt zu den Lernprozessen, Geller, Neumann & Fischer, 2014), und/oder dass die Lernenden wenig differenziertes und aussagefähiges Feedback erhalten. Hier könnte eine Rolle spielen, dass Physik in NRW ein Nebenfach ist, in dem keine Klassenarbeiten geschrieben werden und wohl auch ansonsten Leistungsüberprüfungen nur in geringem Maße stattfinden (s. Teilprojekt zur Sichtstruktur des Unterrichts, Beerenwinkel & Börlin, 2014).

Rezension speichern und teilen
Im Kontext

nrw-wappenSchulentwicklung NRW

Diese Rezension wurde erstellt von:
Trendel, Georg, Dr., Referent für Naturwissenschaften, Arbeitsbereich 5: Unterrichtsentwicklung, Standardüberprüfung, Qualitäts- und Unterstützungsagentur – Landesinstitut für Schule des Landes Nordrhein-Westfalen (QUA-LiS NRW).

Sie haben Fragen oder Anregungen?

Schreiben Sie uns!