Lade Inhalt...

Experimentiertests im trinationalen Vergleich

QUiP - Studien zum Physikunterricht in 3 Ländern

Masterarbeit 2012 115 Seiten

Physik - Didaktik

Leseprobe

Inhaltsverzeichnis

1. Einleitung
1.1.Problemstellung und Ziele der Arbeit
1.2.Thematische Eingrenzung
1.3.Forschungsabsicht

2. Theoretische Bezüge
2.1.Zusammenhänge und Begriffe
2.1.1. Die historischen Quellen des Experiments
2.1.2. Fachdidaktische Prinzipien
2.1.3. Kompetenzmodelle
2.1.4. Schulleistungserhebungen
2.2.Das Experiment: Theorie und Schulpraxis
2.3.Pädagogischer Bezug

3. Forschungsbericht
3.1.Das Forschungsprojekt QuIP
3.2.Der Experimentiertest
3.3.Testkonstruktion und Zielsetzung
3.4.Aufgabenstellungen
3.4.1. Fallanalyse: Task "Rätselhafte Kisten"
3.5.Stichprobe und Daten

4. Datenanalyse
4.1.Items und Bewertungsverfahren
4.2.Methodisches Vorgehen und Ergebnisse
4.2.1. Vergleich bezüglich der Schultypen
4.2.2. Vergleich bezüglich Geschlechterzugehörigkeit
4.2.3. Vergleich bezüglich Chancengleichheit

5. Diskussion der Resultate
5.1.Hauptargument
5.2.Wichtigste Ergebnisse
5.3.Würdigung und Kritik

6. Fazit und Ausblick

7. Literatur / Quellen

8. Anhang

9. Verzeichnis der Abbildungen

10. Tabellenverzeichnis

11. Erklärung

[ Eis – Tauchgang in einem Bergsee.

Forschungsstation in den Peruanischen Anden]

Johanna: You really send him under the ice?

He isn't a slave or convict or anything, is he?

Dr. Laurence: My dear, science is a cruel mistress.

Johanna: How is he going to breathe?

Dr. Laurence: He isn't.

Abbildung in dieser Leseprobe nicht enthalten

Filmzitat und Bilder aus „ Le Grand Bleu

(Luc Besson 1988, Gaumont Paris)

Abbildung in dieser Leseprobe nicht enthalten

Ich bedanke mich zunächst beim Zentrum für Naturwissenschafts- und Technikdidaktik der Pädagogischen Hochschule FHNW, insbesondere bei Prof. Peter Labudde, für die Ermöglichung eines vertieften Einblicks in ein aktuelles internationales Forschungsprojekt. Ich konnte wertvolle Erkenntnisse auf verschiedenen Ebenen gewinnen.

Besonderer Dank gebührt Herrn Johannes Börlin, der mich in der Erstellung der Arbeit unterstützt und mich mit wertvollen Hinweisen und Material versorgt hat. Prof. Roland Reichenbach danke ich herzlich für das entscheidende kure Gespräch in einer Phase des Zweifelns.

Meiner Familie danke ich besonders für das mir entgegengebrachte Verständnis, das zu gewissen Zeiten während der Erstellung einer Qualifikationsarbeit nötig ist.

1. Einleitung

Die vorliegende Arbeit basiert auf erhobenen Daten und Untersuchungen der trinationalen Studie „ Quality of Instruction in Physics Education “ (QuIP). Ziel dieses Forschungsprojektes ist die wissenschaftliche Beantwortung von Fragen hinsichtlich der Qualität des Physikunterrichtes von Jugendlichen aus den drei beteiligten Ländern Finnland, Deutschland und der Schweiz. Den Ausgangspunkt der Fragestellungen von QuIP bildeten die Ergebnisse der PISA[1] – Studien der Jahre 2000 bis 2006 (OECD, 2007), welche den finnischen Schülerinnen und Schülern eine signifikant höhere Leistung im Schulfach Physik attestierten im Vergleich zur deutschen und schweizerischen Stichprobe.

Besonderes Interesse bilden in den nachfolgenden Ausführungen zwei makrostrukturelle Faktoren von Schulleistung. Ich werde einerseits die Geschlechterzugehörigkeit hinsichtlich Schul- und Leistungserfolg im Unterrichtsfach Physik hinterfragen. Anderseits werde ich nach der Wechselwirkung zwischen Schulleistung und Schultyp im Physikunterricht fragen.

Ein persönliches Motiv für die Themenwahl dieser Arbeit bilden meine eigenen Erfahrungen als Lehrperson auf der Sekundarstufe I im mathematisch–naturwissenschaftlichen Bereich. Ich habe selbst während 8 Jahren als Klassenlehrer auf der Realschulstufe gearbeitet und vermittelte in dieser Funktion auch das Fach Naturlehre. Zudem habe ich als Schulleiter auf der Sekundarstufe I Einblicke in ein Konzept geschlechtergetrennten Unterrichtens im Naturlehre – Unterricht gewinnen können.

1.1. Problemstellung und Ziele der Arbeit

Meine Arbeit ist einem Themengebiet zuzuordnen, das sich auf einen fachdidaktischen Aspekt des Physikunterrichts konzentriert, nämlich auf das praktische Experimentieren mit Schülerinnen und Schülern. Im Speziellen untersuche ich nachfolgend, ob und wie Experimentiertests eingesetzt werden können um in einer Vergleichsstudie Aussagen über die Schülerleistung und über spezifische Voraussetzungen des Unterrichts zu machen.

Davon ausgehend interessiert mich insbesondere die Frage, ob das Ausmass der Kompetenz naturkundlichen Verständnisses von Jugendlichen in einem Experimentiertest aussagekräftig abgebildet werden kann. Ich werde untersuchen, ob sich die Ergebnisse des Experimentiertests mit den Ergebnissen aus den schriftlichen Leistungserhebungen decken. Hier wird insbesondere die Frage interessieren, ob die Stichprobe der finnischen Schülerinnen und Schüler innerhalb QuIP und insbesondere im Rahmen des Experimentiertests die herausragenden Resultate in den PISA Studien reproduzieren kann. Die Frage wird zudem zu stellen sein, welcher Art die Kompetenzen sind, welche heute in vergleichenden Studien gemessen werden.

Zusätzlich zu den bereits erwähnten Aspekten wird meine Arbeit versuchen Antworten zu finden auf die Frage der generellen Relevanz vergleichender Studien hinsichtlich des Unterrichtserfolges von Schülerinnen und Schülern. Die öffentlichen Schulsysteme grosser Teile der modernen Welt werden seit geraumer Zeit und ausgehend von supranationalen Organisationen wie der OECD oder der UNESCO hinsichtlich Schulleistungserfolges und Kompetenz – Zuwachsraten analysiert. Auf diese Weise gesammelte Daten dienen unter anderem dem Leistungsvergleich zwischen den Nationalstaaten. Damit ist der Wettbewerbscharakter von vergleichenden Schulleistungstests offensichtlich. Es kann zwar im Rahmen des fokussierten Vorhabens meiner Arbeit nicht darum gehen, die Auswirkungen von Education Governance (vgl. Uwe Schimank in Benz, 2007) aus der Perspektive von politischer Schulführung zu untersuchen. Dennoch möchte ich es nicht unterlassen, allfällige Hinweise auf diesbezüglich fragwürdige (Teil-)Ergebnisse meiner Untersuchung aufzuzeigen (vgl. Kap. 2.1 und Kap. 5).

Damit ergibt sich die Überleitung zu meiner vorläufigen These der vorliegenden Arbeit. Ich werde weniger die fachdidaktischen Komponenten und die Methodik des Physikunterrichts reflektieren, sondern vielmehr versuchen, sozioökonomische Faktoren des gelingenden Unterrichts am exemplarischen Beispiel der trinationalen Vergleichsstudie QuIP aufzuzeigen. Ich werde versuchen, die soziologischen Konstrukte der Chancengleichheit, der Geschlechterfrage und der Statuszugehörigkeit im Hinblick auf den untersuchten Experimentiertest im Physikunterricht gleichsam exemplarisch zu hinterfragen.

1.2. Thematische Eingrenzung

Das Experiment im naturwissenschaftlichen Unterricht, namentlich im Physikunterricht, geniesst eine lange Tradition in der Geschichte der Schule. Wenn im Unterricht experimentiert wird, dann bezeichnet man damit das handelnde Tun am Gegenstand eines didaktisch aufbereiteten Themas. Das kann einerseits in Form einer Demonstration (Lehrerexperiment) oder aber in Form von Einzel- und Gruppenarbeit durch die Schülerinnen und Schüler selbst erfolgen (Schülerexperiment). Der Begriff Experiment ist damit aber längst nicht hinreichend differenziert. Es zeigt sich, dass das Experimentieren im Verlauf der Unterrichtsgeschichte selbst zu einem Lehr- und Lerngegenstand geworden ist. Neben fachdidaktischen Aspekten gelangten zunehmend auch wissenschaftstheoretische Überlegungen in die Diskussion über die adäquate Verwendung des Experiments im Physikunterricht. Eine aktuelle fachdidaktische Sichtweise geht auf den kritischen Konstruktivismus zurück, der im Anschluss an die rationale Wende im Deutschland der Nachkriegszeit entstand.

Basierend auf Klafkis Bildungstheorie entstand seit den 1960-er Jahren die bildungstheoretische Didaktik, welche u.a. mittels eines Perspektivenschemas versucht, die unterrichtlichen Inhalte in verschiedenen Dimensionen zu analysieren. Unterrichtsprinzipien wie Exemplarisches Lehren und Lernen, Handlungsorientiertes Lernen sowie Verbindung von sachbezogenem und sozialem Lernen beeinflussten vornehmlich die Debatte in der Naturwissenschaftsdidaktik zu Gunsten der Propagierung des experimentierenden Forschens im Unterricht (vgl. Berner, 1999). Aus wissenschaftstheoretischer Sicht sollen Schulexperimente „… dazu beitragen, relevante Aspekte des Erkenntnisprozesses zu illustrieren. Als besonders wichtig wird in dem Zusammenhang die Verbindung zwischen den physischen und mentalen Handlungen erachtet.“ (vgl. Duit und Tesch, in Vorb. und Millar et al. 2002, zit. nach Börlin, in Vorb.).

Die vorliegende Arbeit muss sich darauf beschränken, den Prozess der Aufgabengenerierung für den verwendeten Experimentiertest nachzuzeichnen. Die Konstruktion von geeigneten Aufgabenstellungen im Bereich des experimentierenden Handelns im Physikunterricht stellt indessen einen eigenständigen Forschungs- und Untersuchungsbereich dar (vgl. Ruiz-Primo / Shavelson, 1996).

1.3. Forschungsabsicht

Das Erkenntnisinteresse der vorliegenden Arbeit fokussiert auf die Analyse vorliegender Untersuchungsdaten aus einem durchgeführten Experimentiertest bei rund hundert Schulklassen in den beteiligten Ländern Finnland, Deutschland und der Schweiz. Ich skizziere den zugrunde liegenden Forschungsprozess lediglich aus der Beobachterperspektive. Da ich selbst nicht an der Konstruktion des Forschungsdesigns, der Vorbereitung, Durchführung und Nachbereitung der Studie beteiligt war, analysiere ich den (Teil-) Forschungsprozess also im Nachhinein. Dies hat einige Einschränkungen und Restriktionen für mein Arbeitsvorhaben zur Folge:

1. Ich habe keinen Einfluss auf die Generierung der durchgeführten Tests. Vielmehr noch, ich übernehme gemachte Annahmen und theoretische Bezüge zur Test – Konstruktion und beurteile diese im Nachgang der Untersuchung.
2. Die Auswahl, Begründung und Verteilung der Gesamt-, sowie der Teilstichproben in den Partnerländern können ebenfalls nur nachvollziehend beschrieben werden. Eine diesbezügliche Doku-mentation liegt indessen in der Dissertation von Johannes Börlin (Börlin, in Vorb.) in übersichtlicher Form vor.
3. Die Situierung der mich interessierenden Daten in einer umfassenden internationalen Vergleichsstudie hat zur Folge, dass zahlreiche interessante Forschungsfragen bereits gestellt worden sind zur durchgeführten Erhebung. Die Einschränkung auf die Daten des Experimentiertests, der noch nicht ausgewertet wurde, drängt sich indessen auf.

In der vorliegenden Arbeit geht es also vor allem darum, eine bestehende Lücke im Forschungsprozess zu besetzen. Diese besteht innerhalb der betreffenden Studie QuIP hauptsächlich in der Untersuchung der Resultate des durchgeführten Experimentiertests.

Im Vorfeld zur quantitativen Untersuchung der Daten aus dem Experimentiertest werde ich mit meiner Arbeit versuchen, Antworten auf die Frage nach Funktion und Zielsetzung der Unterrichtsform „Experimentieren im Physikunterricht“ zu finden. Dies wird in einem theoretischen Teil durch Analyse ausgewählter Literatur erfolgen. Vornehmlich interessieren mich der allgemeindidaktische Ansatz von Wolfgang Klafki sowie die fachdidaktischen Grundlagen von Martin Wagenschein und seiner Rezeption.

Teil I der vorliegenden Arbeit widmet sich somit der Aufarbeitung des konstruktivistischen Ansatzes aus pädagogischer Sicht, vornehmlich seiner Anwendung im Physikunterricht. Teil II fokussiert die Untersuchung der erhobenen Daten aus dem Experimentiertest hinsichtlich der Perspektiven Geschlechterzugehörigkeit und Chancengleichheit.

2. Theoretische Bezüg e

Wozu braucht die moderne Schule überhaupt einen naturkundlichen Unterricht? Sind naturwissenschaftliche Bildungsziele relevant für die heutige Gesellschaft? Diese beiden Fragen sollen einleitend zum theoretischen Teil eine Provokation auslösen.

Mit Bezugnahme auf Martin Wagenscheins didaktischen Ansatz eines zeitgemässen naturwissenschaftlichen Unterrichts hat Ueli Aeschlimann in seiner Dissertation „ Mit Wagenschein zur Lehrkunst “ festgehalten:

„Ein ehemaliger Physikprofessor und Präsident der New Yorker Akademie der Naturwissenschaften zieht folgendes Fazit: 90% der Amerikaner und Amerikanerinnen haben von Naturwissenschaft keine Ahnung. Die Schüler und Schülerinnen vergessen das mühsam erarbeitete Wissen über Physik und Chemie sofort wieder, wenn sie die Schule beendet haben. Jürgen Oelkers, Pädagogikprofessor in Bern, sagt dazu: „Wenn man so weitermacht, sind die hohen Anstrengungen der Schule relativ vergeblich“ Er fordert deshalb, den naturwissenschaftlichen Unterricht zu verbessern, „...indem er vermehrt Vorgänge des alltäglichen Lebens durchsichtig macht. Das wäre vielversprechender als nur Formeln auswendig zu lernen.“

In einer technisch geprägten Welt gehören meiner Ansicht nach Kenntnisse aus der Naturwissenschaft zur Allgemeinbildung. Unseren komfortablen Lebensstil und auch viele Arbeitsplätze verdanken wir letztlich den Erkenntnissen der Naturwissenschaften. Im Unterricht geht es aber darum, die Naturwissenschaft als Teil der Allgemeinbildung zu sehen. Es geht nicht darum, Physiker und Chemiker auszubilden, die konkrete Probleme berechnen können, sondern es geht darum, an ausgewählten Themen zu zeigen, wie sich Physik und Chemie mit der Natur auseinandersetzen und welche Konsequenzen das für unser Leben und Denken hat. Dafür hat sich Wagenschein eingesetzt, und von Hentig sagt zu recht: „Wir brauchen in Deutschlands Schulen nichts dringender als Wagenscheins Pädagogik.“ Die Diskussion um eine Veränderung des von Stofffülle geprägten Physik- und Chemieunterrichts hin zu einem exemplarischen Unterricht, der „Vorgänge des täglichen Lebens durchsichtig macht“ (Oelkers, siehe oben), der durch die Verbindung zur Alltagswelt „einen emotionalen Bezug zum Lerngegenstand herstellt“ (Labudde 1997), hat zu Beginn unseres Jahrhunderts mit Kerschensteiner angefangen und ist auch heute immer noch aktuell.“ (Aeschlimann 1999, S. 194)

Es wurden hier also Forderungen benannt, die naturkundliche Unterrichtspraxis zu überdenken und damit den Unterrichtserfolg zu beeinflussen, zu reformieren und nachhaltig zu verbessern. Damit ist der Stellenwert von naturwissenschaftlichem Unterricht, respektive der damit zu erzielenden Bildungsinhalte vorgezeichnet: Es geht heute immer mehr darum, gezielt zu investieren in eine breite allgemeine Bildung, die auch Teile unserer modernen, durch Technologie geprägten Welt begreifbar macht. Ein damit verbundenes modernes Demokratieverständnis unterstützt diesbezügliche Steuerungsabsichten: Nur wer die Grundlagen unserer modernen Welt wenigstens teilweise versteht, kann auch mitdenken in politischen Prozessen, um beispielsweise Chancen und Risiken moderner Technologien oder dem Abbau natürlicher Ressourcen gegeneinander abwägen.

2.1. Zusammenhänge und Begrifflichkeit

2.1.1. Die historischen Quellen des Experiments

Während bereits im 17. Jahrhundert die Orientierung am (naturwissenschaftlichen) Experiment zum Fundament westlicher Bildung wurde und als Grundlage aller Erkenntnis gegolten haben mag (vgl. Bacon 1620), scheint die postindustrielle Welt von heute immer noch an diesem Paradigma festzuhalten.

„Der Mensch, der Diener und Ausleger der Natur, wirkt und weiß so viel, als er von der Ordnung der Natur durch Versuche oder durch Beobachtung bemerkt hat; weiter weiß und vermag er nichts.“

„Zwei Wege gibt es zur Untersuchung und Auffindung der Wahrheit – es kann nicht mehrere geben. – Der eine ist ein Sprung von der sinnlichen Wahrnehmung und von Einzelnen zu höchst allgemeinen Grundsätzen; aus diesen höchsten Wahrheiten werden sodann die Mittelsätze aufgefunden; dieser Weg ist der jetzt gewöhnliche. Der andre leitet von der sinnlichen Wahrnehmung und vom Einzelnen ebenfalls Grundsätze her; aber er steigt dann allmählich und stufenweise höher, bis er erst ganz zuletzt zu den allgemeinsten, höchsten gelangt – das ist der wahre Weg, aber noch unbetreten.“ (Bacon 1620 / Brück 1974).

In diesem Ausschnitt aus „ Novum Organum scientiarum “ erscheint bereits das Paradigma der Industriellen Revolution herauf, das es der westlichen Welt möglich gemacht hat, die Naturgesetze dem Menschen zu eigen zu machen. In der Nachfolge der Industriellen Revolution entstand bekanntlich die moderne Zivilisation mit ihren technischen Errungenschaften.

Im pädagogischen Kontext wurde mit Bacon und anderen seiner Zeit die Grundlage für den Physikunterricht der Moderne gelegt. Das Experiment als Grundlage des empirisch gesicherten Wissens wurde in jener Zeit begründet. Nun ist aber das Experiment im Rahmen der wissenschaftlichen Erkennt-nisbildung nicht dasselbe wie das Experimentieren als unterrichtliches Prinzip. Im naturwissenschaftlichen Unterricht spielt das Experiment als didaktische Lehr- und Lernform oftmals die Rolle eines nachvollziehenden Konstrukts (vgl. Bruggmann 2011). Es wird von Lehrpersonen versucht, den Schülerinnen und Schülern wissenschaftsgeschichtliche Erkenntnis gleichsam zum Nacherleben aufzubereiten.

2.1.2. Fachdidaktische Prinzipien

Moderne fachdidaktische Prinzipien gehen von konstruktivistischen Ansätzen aus. In der Physikdidaktik spielen die Erkenntnisse von Martin Wagenschein eine wichtige Rolle. Sein Ansatz einer genetisch – sokratisch – exemplari-schen Methode fand breite Rezeption und mannigfaltige Weiterentwicklungen. Insbesondere Wolfgang Klafkis kritisch- konstruktive Didaktik als Anwendungsgebiet der kritisch-konstruktiven Erziehungs-wissenschaft weist mehrfache Wechselwirkung mit den Arbeiten Wagenscheins auf. Die Methode Wagenscheins findet ihre vorläufige Ausdifferenzierung in der Lehr-kunstdidaktik, die das Element der Dramaturgie in den didaktischen Prozess der Unterrichtsgestaltung miteinbezieht (vgl. Aeschlimann 1999). Es geht bei dieser Methodik darum, dem schwierigen Schritt des „verstehen Lernens“ eine sinnvolle Hilfestellung im Sinne von Platons Blickwendung (vgl. Benner / Stepkowski 2011) hinzuzufügen. Exemplarisch sind Lehrinhalte, wenn sie zu nachhaltigem Nachdenken über Ursachen und Zusammenhänge in der Menschheits- und Wissenschaftsgeschichte angeregt haben. Genetisch sind die Lehrgegenstände, wenn sie die Lernenden dazu anregen (oder bestenfalls gar dazu zwingen), den Lernweg selbst beschreiten zu müssen. Verständnis ist nur für diejenigen möglich, die sich des Verstehens aus eigener Kraft ermächtigt haben. Und als dramaturgisch schliesslich werden Lehrinhalte aufbereitet mit dem Ziel, eine gelenkte und regietechnisch durchdachte und begründete Abfolge von Schritten einer Inszenierung des geplanten Wissensgewinns für die Lernenden zu schaffen. Dies ist vergleichbar mit der Regieführung im Theater oder im Film.

In den Naturwissenschaften geniesst das Experiment seit jeher einen besonders wichtigen Stellenwert unter den Methoden. Ein Experiment beschreibt generell eine spezifische Fragestellung an die Natur. Mittels Beobachtung, Beschreibung und Überprüfung werden Antworten gesucht. Naturwissenschaftliche Hypothesen werden meist experimentell überprüft. Mittels gesammelter und protokollierter Daten werden aus den Ergebnissen Schlussfolgerungen gezogen, die zu neuen Erkenntnissen führen können. Auch im Unterricht spielt das Experiment eine wichtige Rolle. Während in früherer Zeit oftmals das Experiment als Demonstrationszweck durch die Lehrperson ausgeführt wurde, ist die Fachdidaktik heute vermehrt der Ansicht, dass Experimente die von Schülerinnen und Schülern selbst ausgeführt werden, bessere Lernergebnisse ermöglichen.

2.1.3. Kompetenzmodelle

Im Kompetenzmodell Naturwissenschaften der nationalen Bildungsstandards (EDK 2011) sind in Anlehnung an Weinert drei Dimensionen des Kompetenzbegriffs (vgl. Weinert 2001) aufgeführt, nämlich Handlungsaspekte, Themenbereiche und Niveaus, vgl. Abb 2.1.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2.1 - Das dreidimensionale Kompetenzmodell, HarmoS Naturwissenschaften+

In der ersten Dimension wird unter „Handlungsaspekte“ explizit die Kompetenzfacette „Fragen und untersuchen“ aufgeführt. Je nach beschriebenem Themenbereich und entsprechendem Kompetenzniveau wird unter diesem Handlungsaspekt mehrfach das experimentelle Handeln der Kinder und Jugendlichen beschrieben. Genannt werden folgende Teilaspekte:

- Bewusst wahrnehmen: Phänomene (Lebewesen, Gegenstände, Situationen, Prozesse) aufmerksam betrachten, genauer erkunden, beobachten, beschreiben und vergleichen.
- Fragen, Probleme und Hypothesen aufwerfen, um Beobachtungen, Entdeckungen und technische Konstruktionen zu ermöglichen und zu steuern.
- Geeignete Werkzeuge, Instrumente und Materialien auswählen und verwenden für Erkundungen, Untersuchungen, Experimente und technische Konstruktionen.
- Erkundungen, Untersuchungen oder Experimente durchführen:

Fragen und Probleme aufgrund von Beobachtungen und Vorkenntnissen aufwerfen, Erkundung, Untersuchung oder Experiment planen und durchführen, Daten sammeln und auswerten, Hypothesen überprüfen bzw. Sachverhalte und Regelhaftigkeiten erkennen und festhalten.

- Über Ergebnisse und Untersuchungsmethoden nachdenken: Ergebnisse und Schlussfolgerungen aus Untersuchungen, Erkundungen und Experimenten beurteilen und bewerten, Frage- und Problemstellungen, Versuchsanlagen, Untersuchungs- und Messmethoden sowie technische Konstruktionen reflektieren, hinterfragen und dazu Verbesserungen vorschlagen. (vgl. EDK 2011).

In diesem Zusammenhang wird deutlich, dass es eigentlich ausschliesslich um die Beschreibung von Schüleraktivitäten geht. Das vorliegende Kompetenzmodel geht ganz bewusst von „ich kann…“ – Formulierungen aus um die jeweiligen Fertigkeiten und Lerngewinne der Schülerinnen und Schüler zu beschreiben.

Die Hypothese zu diesen Setzungen lautet demzufolge, dass ein naturwissenschaftlicher Unterricht mit einem hohen Anteil an experimenteller Tätigkeit der Kinder und Jugendlichen einen entsprechend hohen Lerngewinn verspricht. Und dieser wiederum sei messbar, auch in vergleichenden Schulleistungstests, so lautet die Annahme.

2.1.4. Schulleistungserhebungen

„PISA ist das umfassendste und weitreichendste internationale Programm zur Erfassung von Schülerleistungen und Daten über schülerspezifische, familiäre und institutionelle Faktoren, die zur Erklärung von Leistungsunterschieden herangezogen werden können.“ (OECD 2007, 10)

Im Jahr 2006 ging der erste Zyklus der internationalen Vergleichsstudie PISA der OECD zu Ende. Im Abstand von 3 Jahren wird jeweils ein anderer Schwerpunkt im Abschlussjahrgang der obligatorischen Schulzeit der verglichenen Schulsysteme getestet. 2006 waren die Naturwissenschaften das erste Mal schwerpunktmässig getestet worden. Die Fachbereiche Lesekompetenz und Mathematik wurden dabei als Nebenkategorien erhoben.

Internationale Schulleistungstests machen Aussagen zum Stellenwert schulischer Ziele in einer Gesellschaft. Seit der ersten PISA Studie im Jahr 2000 waren dies die drei bereits benannten Kompetenzbereiche Mathematik, Naturwissenschaften und Lesekompetenz. Den Schweizer Jugendlichen wird in der Auswertung der PISA Studie 2006 ein gutes Ergebnis in den Naturwissenschaften attestiert. Der Zusammenhang zwischen sozioökonomischem Hintergrund und der ermittelten Leistung war signifikant positiv. Ebenso wurde eine statistisch signifikante Abhängigkeit der Leistungen vom Geschlecht der Jugendlichen ermittelt: Schweizer Mädchen erzielten eine geringere Leistung im Vergleichstest als ihre gleichaltrigen männlichen Schulkollegen. Das naturwissenschaftliche Interesse und die Einstellung zu den Naturwissenschaften waren bei den Schweizer Schülerinnen und Schülern des Abschlussjahrgangs vergleichsweise niedrig. Die Zielsetzungen der OECD im Zusammenhang mit der internationalen Vergleichsstudie PISA fokussieren insbesondere auf die Kernbereiche Grundbildungskonzept, Untersuchte Altersgruppe und Relevanz für das lebenslange Lernen:

- „… PISA definiert den Erhebungsbereich Naturwissenschaften … nach der Beherrschung … von Kenntnissen und Fähigkeiten, die für eine aktive Teilhabe an der Gesellschaft benötigt werden.
- Mit der Beurteilung der Leistungen 15-Jähriger, d.h. junger Menschen gegen Ende ihrer Pflichtschulzeit, liefert PISA wichtige Indikatoren für die globale Leistungsfähigkeit von Schulsystemen.
- PISA beschränkt sich nicht auf die Beurteilung von Kenntnissen und Fähigkeiten der Schülerinnen und Schüler, sondern befragt diese auch nach ihrer Lernmotivation, ihrer Selbsteinschätzung und ihren Lernstrategien sowie ihren Zielen in Bezug auf künftige Studien und Berufsaussichten.“ (OECD 2007, 64)

Die supranationalen Steuerungsorgane der OECD postulieren, hinsichtlich Effektivität und Effizienz von nationalen Bildungssystemen über Verfahren und Instrumente zu verfügen, deren Messresultate eine transparente Sicht und die Kontrolle über sowohl zwischenstaatliche als auch innerstaatliche Parameter für die künftige Ausrichtung von Bildungssystemen erlauben.

2.2. Das Experiment: Theorie und Schulpraxis

Es gibt prinzipiell drei Grundziele von naturwissenschaftlichem Unterricht: Erstens die Rekonstruktion naturwissenschaftlicher Methoden, zweitens die Vermittlung der Vorstellung von naturwissenschaftlichem Forschen und drittens das Lernen mithilfe von Experimenten. Hodson hat diese Kategorien wie folgt benannt:

- learning science
- learning about science
- doing science (Hodson 1993, zit. nach Tesch 2004, 52).

Das Experimentieren im Unterricht dient also unterschiedlichen Zwecken. Mehr noch werden die Ziele experimenteller Tätigkeit in der Schule beeinflusst durch die subjektiven Einstellungen der Lehrpersonen gegenüber den entsprechenden Unterrichtszielen. Eine 1998 in Europa durchgeführte Delphi-Studie[2] konnte zeigen, welche Ziele Lehrpersonen mit dem Experimentieren in der Sekundarstufe II und der Universität verbinden:

- Verbindung von Theorie und Praxis
- Experimentelle Fähigkeiten
- Methoden wissenschaftlichen Denkens
- Motivation, Entwicklung der Persönlichkeit und der sozialen Kompetenz
- Überprüfung von Wissen (vgl. Welzel et al, 1998, zit. nach Tesch 2004).

Es fällt auf, dass Lehrpersonen gemäss dieser Studie ihre Zielvorstellungen des Unterrichts dem Fachbereich gemäss fokussieren. Es kommt demzufolge im Unterricht zu verschiedenartigen Experimentiersituationen, die unterschiedlichen Zielen dienen. Es gilt zu beachten, dass auch beim Erlernen naturwissenschaftlicher Denk- und Arbeitsweisen das Prinzip des exemplarischen Lernens gelten sollte, ohne sich dabei auf eine methodische Monokultur zu beschränken (vgl. Tesch 2004, S. 52).

Vor allem das Lernen mithilfe von naturwissenschaftlichen Experimenten verlangt eine sorgfältige Verschränkung von theoretischen und praktischen Phasen für die Tätigkeiten von Schülerinnen und Schülern. Aus einem derartigen didaktischen Wechselspiel sind die besten Lernleistungen zu erwarten.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2.2 - Das Verhältnis von Experiment und physikalischem Konzept/Gesetz

Für den Lernerfolg im naturwissenschaftlichen Unterricht scheint also die subtile Balance zwischen Theorie und Experiment massgeblich zu sein. Das angeleitete Lernen und die eigenständigen Phasen wie Exploration und Diskussion der Experimente sollten ausgewogen sein. Durch das Experimentieren werden Lerngelegenheiten geschaffen, die erst durch eine Einbindung in das übrige Unterrichtsgeschehen ihren Sinn erhalten und den Kindern und Jugendlichen zu den erwünschten Einsichten verhelfen. (vgl. Tesch 2004).

2.3. Pädagogischer Bezug

Die Leistung einer geeigneten Verknüpfung von präsentierten und rezipierten Lehr- und Lerninhalten mit den passenden selbsttätigen und eigenaktiven Lerngelegenheiten obliegt den Lehrpersonen. Ihre didaktische und methodische Aufbereitung von Lerninhalten macht den entscheidenden Wirkfaktor hinsichtlich der zu erwartenden Lernleistung von Schülerinnen und Schülern aus. Ausgehend von internationalen Vergleichstests zur Schulleistung ist derzeit eine intensivierte Forschungsaktivität hinsichtlich der Bedingungen von Lernerfolg zu verzeichnen. Diese Bemühungen fokussieren u.a. auch auf den Bereich der Naturwissenschaften. Gründe dafür sind einerseits das relativ mässige Abschneiden der Schülerinnen und Schüler Deutschlands und der Schweiz in den PISA Erhebungen 2000 bis 2006. Anderseits ist gerade in den westlichen Industrieländern nach wie vor ein erheblicher Mangel an Berufsfachkräften in den Bereichen technischer Richtung zu verzeichnen. Um nicht - noch im verstärkten Masse - abhängig zu werden von Berufsleuten aus dem Ausland, verschärfen diese Länder ihre Anstrengungen im Bereich der naturwissenschaftlichen Grundbildung. Dies in der Hoffnung, dass verbesserte Schulleistungen auch zu mehr qualifizierten Arbeitskräften in den jeweiligen Bereichen führen können.

Videostudien der jüngeren Vergangenheit haben gezeigt, dass in der Unterrichtsgestaltung im naturwissenschaftlichen Bereich Schwachpunkte auszumachen sind. „Methodische Engführung, geringes Ausmass lernprozessbegleitender Unterstützung, umfangreiche instruktionale Phasen und – trotz des Stellenwerts des Experiments – wenig Gelegenheiten für selbständige Schülerarbeit und kaum Anlässe für selbstregulierte Lernprozesse und für den Einsatz binnendifferenzierender Massnahmen“ (Bruggmann Minnig 2011) ist die vorläufige Bilanz aus Recherchen verschiedener Studien hinsichtlich Unterrichtsführung und Lernerfolg.

Forschungsbefunde und wissenschaftliche Ergebnisse zu Unterrichtsführung und –gestaltung machen m.E. nur Sinn, wenn man den (Miss-)erfolg von Schulunterricht verdeutlichen kann. Und das hängt wiederum von den Möglichkeiten zur Leistungsüberprüfung ab. Was in der gegenwärtigen Zeit als unbestreitbar gilt, nämlich dass Lernleistungen valide und im vergleichenden Sinn erhoben werden können und damit ein Bildungsmonitoring innerhalb und zwischen den beteiligten Staaten möglich wird, kann indessen kritisch hinterfragt werden. Schon Klafki (1996, 245 f.) benannte eine „Dialektik des Leistungsbegriffs“ und „Gegenpole des Leistens“, wie Lebensqualität, Glückserfahrungen und Spiel, die ebenfalls berechtigterweise der Schule ihren Sinn geben können und die bisher kaum im Blickpunkt von Schülerbeurteilungen stehen. Häussler schlägt deshalb vor, den Begriff „Lernerfolg“ anstelle von „Leistung“ zu verwenden (vgl. Häussler 2007).

Es bleibt freilich darauf hinzuweisen, dass Leistungsmessung mit dem Ziel der Erfassung von Lernerfolg prinzipiell und ganz allgemein verschiedene Zwecke erfüllen kann. Neben dem Aspekt der summativen Beurteilung, der in vergleichenden Studien massgeblich ist, wird auch der Aspekt der formativen Beurteilung von Bedeutung in der Betrachtung von Unterrichtserfolg. Bei dieser steht nicht eine Distinktions- oder Selektionskomponente im Mittelpunkt des Interesses, sondern der individuelle Lernweg einer Schülerin oder eines Schülers. Mittels einer formativen Beurteilung soll sowohl das lernende Individuum, als auch die Lehrperson erkennen können, welche weiteren Schritte auf dem Lernweg in optimaler Weise zu beschreiten sind um den erwarteten Lernerfolg bestmöglich erreichen zu können. In einer modernen Schule steht nicht mehr das individualistische, konkurrenzorientierte Lernen im Vordergrund, sondern das solidarische und soziale Lernen. Die Tendenz zeigt seit den 70-er Jahren weg vom ergebnisorientierten Lernbegriff hin zu einem prozess- und problemorientierten Lernen. Die Neubestimmung des pädagogischen Leistungsprinzips wurde u.a. von „…Wolfgang Klafki oder Hartmut von Hentig als notwendig angesehen, da das Leben in einer freiheitlich-demokratischen Gesellschaft nur befördert werden könne, wenn das anerkannte Erziehungsziel der individuellen Mündigkeit nicht in Widerspruch zu den konzeptionellen Strukturen der Schule gerate.“ (Schaub u. Zenke 2007, S. 390). Als bloss ergänzende Anmerkung sei erwähnt, dass umfangreiche Forschungsbefunde zur Frage nach der Funktion von Leistungsbeurteilung in der Schule bestehen. Häussler verweist auf Kleber (1992) und Sacher (1996) und nennt folgende Funktionen:

- Rückmeldungen für Schülerinnen und Schüler: Informationen über den Grad des Erreichens von Lernzielen
- Rückmeldungen für die Lehrkraft: Hinweise für die Lernberatung und Informationen über den Grad des Erreichens von Lernzielen
- Bewertung als Lernsituation: Aus Fehlern lernen, als Lernprinzip
- Disziplinierungsfunktion: Ansporn, schlechte Zensuren zu vermeiden
- Auslesefunktion: Verteilung von Sozialchancen

(vgl. Häussler 2007)

In diesem Zusammenhang wird deutlich, dass auch die Art der Leistungsmessung einen Anteil am erwarteten Erkenntnisinteresse hat. Auch im Naturwissenschaftlichen Unterricht wird diese Frage einsichtig, wenn der schulische Lernerfolg beurteilt wird. Dabei spielt es zunächst keine Rolle, ob der Prozess im Rahmen des Unterrichts oder im Rahmen von Forschungsbemühungen steht. Es sind in aller Regel die gleichen Prämissen, die für die Beurteilung vorgegeben werden: Ein Messinstrument soll objektiv, reliabel und valide sein. Jede dieser Prämissen zeigt in jedem Teilbereich des zu beurteilenden Lernprozesses seine eigenen Spezifika und Schwierigkeiten. So ist zum Beispiel die Validität im kognitiven Bereich des Unterrichts noch einigermassen gut zu implementieren. Doch auch bei reinen Wissenstests stellt sich die Frage nach Validität bereits zu Recht. „Angenommen in einer Aufgabe ist die richtige Antwort in der Formulierung der Frage bereits enthalten. In diesem Fall würde nicht oder nicht ausschliesslich Wissen erfasst, sondern die Pfiffigkeit, solche versteckten Hinweise aufzuspüren und zu nutzen.“ (Häussler 2007). Die Fähigkeit zum Problemlösen oder zu anderen höheren kognitiven Leistungen sind bereits wesentlich schwieriger valide zu erfassen. Und erst recht an die konzeptionellen Grenzen stösst der Validitätsbegriff im Zusammenhang mit schulischer Leistungsmessung im nichtkognitiven Bereich. Latente Fähigkeiten müssen meist auf Grund von Plausibilitätsüberlegungen aus theoretischen Überlegungen abgeleitet werden (vgl. Häussler 2007).

In den Vereinigten Staaten von Amerika besteht eine längere Forschungstradition im Bereich von Lernstanderhebung und Experimentieren im naturwissenschaftlichen Unterricht. Spätestens seit der auf Präsident George W. Bush zurück gehenden Initiative „ No child left behind “, die im Jahr 2002 in ein Gesetz mündete, ist der Begriff der Schulleistungsergebung von zentraler Bedeutung. Ziel dieses Gesetzes war unter anderem, verstärkt finanzielle und wissenschaftliche Ressourcen in Schulbildung zu investieren und flächendeckend Schulleistungstests einzuführen um die gesetzten Ziele überprüfbar und transparent zu machen. Die Messung und Beurteilung von Lernerfolg in der Schule fungiert wesentlich als Motor der Reformbemühungen des Schulwesens seit den letzten 50 Jahren, zumindest in der westlichen Welt. Die klassische Prüfung im althergebrachten Sinn wurde für die Schule so einerseits zum Steuerungsmittel von Schul- und Entwicklungspolitik, anderseits zum Entwicklungs- und Reforminstrument von Schule selbst: Einige Funktionen von Lernerfolgsmessungen implizieren, den Unterricht stetig zu verbessern, sprich die zu erwartenden Lernleistungen der Schülerinnen und Schüler auf Grund von Erkenntnissen aus den gewonnenen Daten von Tests zu optimieren. Es wird beispielsweise postuliert, dass sich Lernleistungen im naturwissenschaftlichen Bereich signifikant verbessern, wenn formative Beurteilungen im Curriculum festgeschrieben werden (vgl. Shavelson et al. 2008).

Im Zusammenhang mit Unterrichtsentwicklung ist von der Gruppe um Richard Shavelson ein methodisches Prinzip formuliert worden, das sich „ on the fly assessment “ nennt. Diese Interaktionsform im Unterrichtsgeschehen entspricht im Wesentlichen dem Prinzip des „Scaffolding“, welches auf das konstruktivistische Paradigma zurückgeht. Scaffolding (aus dem Englischen: "scaffold" heisst Gerüst, aber auch Schafott) bezeichnet im pädagogisch-psychologischen Zusammenhang die Unterstützung des Lernprozesses durch die Bereitstellung von gezielten Hilfestellungen für die Lernenden. Die Lehrperson gibt Anleitungen, Denkanstösse oder richtungsweisende Ideen an. Sobald die Schülerinnen und Schüler fähig sind, eine bestimmte Teilaufgabe eigenständig zu bearbeiten, wird dieses „Gerüst“ schrittweise wieder entfernt oder abgebaut. Dieses Prinzip findet gegenwärtig auch Eingang in die aktuellen Forschungsbemühungen im Zusammenhang mit Konzepten zur individuellen Förderung. So wird beispielsweise postuliert, dass eine unterrichtsintegrierte und lernbegleitende Diagnostik zwecks individueller Förderung stattfinden müsse mit dem Ziel, „… fortwährend die Diskrepanz zwischen Lernstand und Lernziel zu bestimmen“ (Klieme / Warwas 2011).

Im Zusammenhang mit dem untersuchten Forschungsprojekt QuIP stellt sich insbesondere die Frage, ob und wie sich die „Lerngelegenheit Experimentieren“ im Physikunterricht als Element der unterrichtlichen Qualitätsentwicklung einerseits (vgl. Börlin in Vorb.) und als Element des (supranationalen) Leistungsvergleichs anderseits eignen kann. Der vorliegenden Untersuchung zur Qualität im Physikunterricht vorausgehend kann festgehalten werden, dass insbesondere in Deutschland und der Schweiz das Experiment als Lerngelegenheit eine den Unterricht dominierende Stellung einnimmt. Dagegen erscheint der vergleichsweise deutlich geringere Anteil experimentellen Handelns an der gesamten Unterrichtszeit in Finnland doch bemerkenswert. Die aufgewendete Zeit im Kontext experimentellen Handelns kann indessen nicht in Beziehung zu einem Leistungszuwachs der untersuchten Klassen gesetzt werden (Börlin, in Vorb. 122ff).

Mit der Darlegung der aufgewendeten Unterrichtszeit für experimentierendes Handeln ist noch keine Aussage über die Qualität der untersuchten Experimentierphasen gemacht. Wird diese mittels Tiefenstrukturanalysen erhoben, wie dies in der Studie QuIP der Fall ist, zeigt sich, dass zwischen Qualitätsmerkmalen experimentellen Handelns und dem Leistungszuwachs der Lernenden durchaus ein Zusammenhang besteht: „Fachinhaltlich eingebettete, anspruchsvolle Experimente, deren Ergebnisse sorgfältig reflektiert werden, haben günstige Auswirkungen auf die mittlere Leistungsentwicklung einer Klasse“ (ebd. 136). Was noch weniger erstaunt, ist der Umstand, dass mittels durchgeführter Einzelfallanalysen von besonders hochqualitativen Experimentiereinheiten auf übereinstimmende förderliche Qualitätsaspekte der Lehrenden geschlossen werden kann. In diesen untersuchten Lerngelegenheiten zeigten die Lehrpersonen durchgängig die folgenden Qualitätsaspekte:

1. Das Herstellen von Bezügen und Analogien
2. Das Sichtbarmachen von Prozessen
3. Die Auseinandersetzung mit Schülerbeiträgen
4. Die Orientierung an Vorstellungen

Börlin zieht den vorläufigen Schluss, dass „sowohl kommunikative als auch Führungskompetenzen des Lehrenden … die hohe Qualität ausmachen“ (ebd. 135). Zusammenfassend lässt sich festhalten, dass aus dem stark fokussierten Forschungsinteresse der Studie QuIP eine durchaus allgemeingültige Erkenntnis folgt: Das Qualitätsmerkmal einer fachlich versierten, didaktisch gebildeten und vor allem einfühlsamen und kommunikativ starken Lehrperson ist der entscheidende Faktor für den Lernerfolg der Schülerinnen und Schüler im Unterricht.

3. Forschungsbericht

Das nachfolgende Kapitel beschreibt die trinationale Studie Quality of Instruction in Physics education (QuiP), deren Forschungsanlage und -er- gebnisse die Grundlage der vorliegenden Arbeit bilden.

3.1. Das Forschungsprojekt QuIP

Das Forschungsprojekt "Quality of Instruction in Physics education - comparing instruction in Finland, Germany and Switzerland" (QuIP) erhebt Merkmale gelingenden Physikunterrichts in deutschen, finnischen und Schweizer Schulen. Die Untersuchung setzt an Resultaten von Internationalen Schulleistungstests wie TIMSS[3] 2000 und PISA 2003 an, die gezeigt haben, dass finnische Schülerinnen und Schüler bei den Leistungstests in Naturwissenschaften signifikant besser abgeschnitten haben als ihre deutschen und Schweizer Kolleginnen und Kollegen. Auf Grund des Forschungsdesigns können aber aus diesen gross angelegten Vergleichsstudien keine Erkenntnisse über den zugrunde liegenden Unterricht gewonnen werden. Die Studie QuiP will daher versuchen, Zusammenhänge zwischen den erwähnten Leistungsunterschieden und dem jeweiligen länderspezifischen Unterricht zu identifizieren und zu beschreiben. Übergeordnetes Ziel bildet hierbei die Identifikation von Qualitätsmerkmalen gelingender Elemente von Unterricht zur Optimierung des Lernerfolgs.

Für die vertiefte Analyse des komplexen Geschehens innerhalb realen Unterrichts genügt es nicht, rein beobachtbare Daten zu berücksichtigen. Neben der Sichtstrukturebene wurden daher auch hochinferente Methoden zur Analyse eingesetzt. Diese Tiefenstrukturanalysen ermöglichen in Ergänzung zur Sichtstrukturanalyse die Bewertung spezifischer Unterrichtsphasen nach festgelegten Qualitätskriterien. Als qualitative Forschungsmethode kommt dabei der Einsatz von Expertenwissen zum Einsatz, indem in der Regel mehrere trainierte Fachpersonen die entsprechenden Daten unabhängig voneinander analysieren und anschliessend ihre Ergebnisse in einem Validitätsprozess zwecks Triangulierung vergleichen.

Der qualitativen Untersuchung zugrunde liegt das systemische Modell für Unterrichtsqualität nach dem Prozess-Produkt Modell von Lipowsky et al. (2005), vgl. Abb. 3.1. Aus Befunden früherer Videostudien ist bekannt, dass sich der Unterricht in unterschiedlichen Ländern hinsichtlich bestimmter Muster unterscheidet. Diese Muster (engl.: „ cultural scripts “) sind kulturgeschichtlich und regional verschieden und bildeten im Rahmen der Studie QuIP ebenfalls ein Hauptinteresse der Forschungsabsicht (vgl. Börlin in Vorb.).

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3.1 - Systemisches Modell für Unterrichtsqualität von Lipowsky et al. (2005): Der Unterricht wird zweiseitig beeinflusst. Als Output des Unterrichts werden Kompetenzveränderungen sowie Veränderungen affektiver Variablen der Schülerinnen und Schüler erwartet und erfasst.

Für die Videostudie wurde eine Doppelstunde Physik zum vorgegebenen Thema „Zusammenhang zwischen elektrischer Energie und Leistung“ in den drei Ländern aufgezeichnet. Die Lehrpersonen wurden zwecks Sicherung vergleichbarer Bedingungen aufgefordert, aus der Unterrichtseinheit Elektrizität, die sie wie gewöhnlich abhalten sollten, jene Doppelstunde auszuwählen, welche am besten zum genannten Thema passte. Die Projektteams analysierten die videografierten Physik - Doppellektionen anschliessend auf der Basis der Kategoriensysteme "Interaktionsformen", "Lehrpersonen-/Schülerinnen- und Schüler-Verbalisation", "Konstruktivismus" und "Experimentelles Handeln".

Sowohl beim Prä- als auch beim Posttest wurden Instrumente zur Erfassung der Schülerkompetenz und Motivation eingesetzt. Das eingesetzte Instrument zur Erhebung des Wissensstandes (CKPT – Content Knowledge Paper Test) wurde von der deutschen Projektgruppe entwickelt. Es umfasst 73 Items und wurde in Anlehnung an das hierarchische Kompetenzmodell von Neumann et al (2007) konstruiert. Die Abfrage von spezifischem Wissen geschieht dabei über das Prinzip „eine (beobachtbare) Tatsache – ein (physikalisches) Konzept“ (Geller 2008). Dabei wurden Themen aus dem Gebiet „Elektrizität und Leistung“, sowie entsprechendes Vorwissen getestet, vgl. Anh. 1 (Geller 2008). Dazu kamen beim Prätest Instrumente zur Erhebung des Lehrer- und Schülerhintergrundes, beim Posttest Instrumente zur Erfassung der pädagogischen und physikalischen Kenntnisse der Lehrperson, sowie ein Experimentiertest für Schülerinnen und Schüler. Letzterer wurde aufgrund des grossen organisatorischen und materiellen Aufwandes ausschliesslich im Rahmen des Posttests durchgeführt und bildet die Grundlage für die quantitative Auswertung in dieser Arbeit in Kap. 4.

Tab. 3.1 zeigt die eingesetzten Untersuchungsinstrumente in einer Übersicht, wobei die Datenquellen von Schülern in zwei Grüntönen, farblich abgehoben von den Datenquellen von Lehrpersonen (rötlich) dargestellt sind.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 3.1 – Übersicht der Erhebungsinstrumente im Rahmen von QuIP

Die Erhebung der Daten erstreckte sich über das Schuljahr 2008 / 2009 (vgl. Börlin in Vorb., S. 35ff).

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3.2 - Zeitlicher Ablauf der Datenerhebung: Prätest, Videoaufnahme einer Doppelstunde und

Posttest. Der Experimentiertest wurde im Rahmen des Posttests durchgeführt.

Die Stichprobe bestand aus insgesamt 99 finnischen, deutschen und Schweizer Klassen des 9. und 10. Schuljahres. Im finnischen Schulsystem gibt es in der Schule keine Trennung nach Leistungstypen, sondern alle Schülerinnen und Schüler werden integrativ in Klassen eines Gesamtschulsystems gemeinsam unterrichtet. In der deutschen und Schweizer Teilstichprobe mussten deshalb alle Leistungsniveaus angemessen mitberücksichtigt werden. Tab. 3.2 stellt die Gesamtstichprobe nach Schultypen und Ländern dar. Die realisierte Stichprobe ist in Deutschland für das Bundesland Nordrhein – Westfalen geografisch repräsentativ, in der Schweiz für den deutschsprachigen Landesteil und in Finnland für eine Region im Umkreis von rund 200 km um die Stadt Jyväskylä.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 3.2: Anzahl der Klassen, verteilt auf Schultypen (0-3) und Länder. Typ 3 entspricht dem höchsten, Typ 2 dem mittleren und Typ 1 dem tiefsten Leistungsniveau. Dem Typ 0 werden Schulklassen zugeordnet, deren Schülerinnen und Schüler sich aus verschiedenen Leistungsniveaus (Schultyp 1-3) zusammensetzen.

Das oberste Leistungsniveau entspricht sowohl in Deutschland als auch in der Schweiz dem Gymnasium. In Deutschland heisst die mittlere Leistungsstufe Realschule (Typ 2) und die tiefste Stufe Hauptschule (Typ 1). Daneben existieren Gesamtschulklassen, welche Schülerinnen und Schüler aus allen Niveaus umfassen. Das unterste Leistungsniveau der Teilstichprobe in Deutschland (Typ 1, Hauptschule) repräsentiert diese Stufe nicht wirklich: Auf Grund der Lehrpläne in Physik für die betroffene Altersgruppe konnte die Hauptschule nicht in reiner Form erfasst werden, sondern es wurden nur die Daten von Schülerinnen und Schülern aus den tiefsten Leistungskursen von Gesamtschulen (sog. G-Kurse) berücksichtigt.

Analog zu Deutschland besteht in der Schweiz ein dreigliedriges Schulsystem auf der Sekundarstufe I. Die Bezeichnungen der Niveaus sind allerdings nicht einheitlich. Um die Komplexität der Studie einzugrenzen, wurden ausschliesslich Schulklassen der Deutschen Schweiz bei der Ziehung berücksichtigt. Aufgrund der kantonal unterschiedlichen Lehrpläne konnten jedoch auch nicht alle Kantone der deutschen Schweiz berücksichtigt werden. Aus verschiedenen Gründen gestaltete sich der Prozess der Stichprobenerhebung in der Schweiz als schwierig: Vor allem wegen der Überbelastung der Schulen durch die Teilnahme an weiteren Studien und Schulentwicklungsprojekten, durch allgemein als hoch empfundene Arbeitsbelastung der Lehrkräfte sowie durch personelle Gründe sagten sehr viele der angefragten Schulleitungen eine Teilnahme ihrer Schule an QuIP ab. Tab. 3.3 zeigt die Verteilung der Schweizer Stichprobe hinsichtlich Herkunft nach Kantonen und Leistungsniveaus.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 3.3 - Verteilung der Schweizer Stichprobe nach Kantonen und Leistungsniveaus 1-3. Die mit * versehenen Klassenzahlen entsprechen jenen Klassen, welche über direkten Kontakt zur Lehrperson für die Teilnahme an der Studie gewonnen wurden. Sie gehören damit nicht zur Zufallsstichprobe.

Im August 2008 waren für die Schweiz ursprünglich 37 Klassen für die Hauptstudie vorgesehen. Im Verlauf der Erhebung sagten sechs weitere Lehrpersonen ihre Teilnahme aus verschiedenen Gründen ab, weshalb die Erhebung schliesslich mit 31 Klassen und deren 28 Lehrpersonen abgeschlossen werden konnte. Somit ergibt sich für die Schweiz folgende prozentuale Verteilung auf die Leistungstypen: Typ 1:35% (36%), Typ 2: 42% (49%) und Typ 3: 23% (15%). Die Angaben in Klammern entsprechen den tatsächlichen Anteilen der Schülerinnen und Schüler in den drei Leistungsniveaus der betreffenden Kantone. Somit ist Typ 3 (Gymnasium) gegenüber der Grundgesamtheit überrepräsentiert, während Typ 2 (meist: Sekundarschule) unterrepräsentiert ist.

Als Forschungspartner wirkten für Deutschland die Universität Duisburg-Essen (Projektleitung Prof. Dr. Hans E. Fischer), für Finnland die Universität Jyväskylä (Projektleitung Prof. Jouni Viiri), sowie für die Schweiz die Fachhochschule Nordwestschweiz (Projektleitung Prof. Dr. Peter Labudde, vormals PH Bern) zusammen. Es sind mehrere Dissertationsprojekte in den drei Ländern zu verschiedenen Unterthemen gestartet worden und befinden sich momentan in der Abschluss- resp. Veröffentlichungsphase. Der durchgeführte Experimentiertest wurde indessen von keinem der beteiligten Forschungsteams weiter bearbeitet.

3.2. Der Experimentiertest

Der Experimentiertest im Rahmen der Studie QuIP wurde vom Schweizer Projektteam geplant, entworfen und in der Umsetzung begleitet. Die Gruppe um Prof. Dr. Peter Labudde (ehemals PH Bern, nun FHNW in Basel) wollte mit dem Einbezug eines praktischen Experimentiertests für die Schülerinnen und Schüler ein zusätzliches Erhebungsinstrument realisieren um diverse Fragestellungen rund um den Themenkreis „Experimentieren“ aufzugreifen. Einer der Gründe für die Entwicklung des spezifischen Testinstrumentes war einerseits die generell hohe Bedeutung, die dem Experimentieren in der Naturwissenschaftsdidaktik (zumindest der deutschsprachigen Länder) beigemessen wird. Schon mehrere wissenschaftliche Studien haben den Stellenwert des Experiments dargelegt (Jonas-Ahrend 2004, Tesch 2005). Allerdings haben erst wenige Untersuchungen den Einsatz von praktischen Experimentieraufgaben als Testinstrument für Lernende erforscht. Es besteht die Hypothese, dass ein Experimentiertest eine ergänzende Facette zum Kompetenzbegriff aufzeigen könnte. So wird erwartet, dass ein Vergleich zwischen herkömmlichen (p aper and pencil-) Testinstrumenten und einem praktischen Experimentiertest vielversprechende Aussagen in theoretischer und in fachdidaktischer Hinsicht liefern könnte.

Der Experimentiertest wurde als Teil des Posttests durchgeführt (vgl. Abb. 3.2). Jede Schülerin und jeder Schüler sämtlicher Klassen der Gesamtstichprobe mussten während einer Lektion (45 Minuten) in selbständiger Einzelarbeit drei praktische Testaufgaben mit einem Zeitbudget von je 15 Minuten lösen. Die Jugendlichen absolvierten einen vorgegeben Circuit im Testraum, wo sie bereits sämtliches Material für die Durchführung der Experimente vorfanden, vergleichbar mit der Postenarbeit im Werkstattunterricht. Insgesamt wurden sechs verschiedene Experimentieraufgaben konstruiert und vor der Hauptstudie pilotiert. Um in allen Klassen vergleichbar viel Material zur Bereitstellung verfügbar zu haben, wurden nur sechs verschiedene Postenabläufe definiert. Zum Vergleich: Da es sich bei der Problemstellung der Aufgabenverteilung mathematisch um eine Kombination ohne Wiederholung handelt, wären maximal 20 verschiedene Aufgabensets[4] möglich. Realisiert wurden aber nur deren 6, da dies die Bereitstellung, die Abläufe in den Klassen, sowie die Auswertung wesentlich erleichtert hat. Bereits in der Pilotierung des Experimentiertests zeigte sich indessen, dass schon mit 6 verschiedenen Sets der logistische Aufwand in der Vorbereitung, sowie der Anspruch an die Kontrollaufsicht während der Durchführung anspruchsvoll und komplex waren. Zusammen mit dem Experimentiermaterial wurden für die Probanden individuelle Testhefte bereitgestellt. In diesen Papieren fanden die Schülerinnen und Schüler sowohl die schriftliche Anleitung zur Bearbeitung der jeweiligen Experimentieraufgabe, als auch die vorgegebene Form des Antwortrasters. In den meisten Fällen war dies einfach genügend Platz im Testheft für die textliche oder grafische Beantwortung einer offenen Fragestellung.

Bei der Konstruktion der Testaufgaben (Tasks) wurde versucht, eine Reihe von Qualitätsanforderungen und Ansprüche an die Praxistauglichkeit für den schulischen Einsatz zu berücksichtigen. Dabei lehnten sich die Entwickler an die von Stebler et al definierten Gütekriterien an (Stebler / Reusser et al, 1998, S. 44ff). Die Problemstellungen sollten für die Schülerinnen und Schüler gleichsam interessant, motivierend und spannend sein. Der Bezug der Tasks zu moderner Technologie oder aktuellen gesellschaftlichen Themen (z.B. zum Thema „Energie sparen im Haushalt“ mit dem Einsatz von Sparlampen, vgl. Abb. 3.3), sowie allfällige Widersprüchlichkeiten zur Alltagserfahrung der Jugendlichen sollten die geplante motivationale Komponente der Aufgabenstellungen unterstützen.

Des Weiteren musste die Konstruktion der Tasks die Bedingung erfüllen, dass die erwartete Experimentierhandlung und deren Beantwortung in den Lösungsheften zu eindeutig beurteilbaren Lösungen führten. Eine Randbedingung war zudem, dass die Aufgabenstellungen überall (zum Beispiel in unterschiedlich grossen Klassen oder bei unterschiedlichem Verhältnis der Geschlechter in verschiedenen Klassen) mit den gleichen Chancen und für alle fair bearbeitet werden konnten. Und schliesslich sollte für die Tasks nur Material zur Verfügung gestellt werden, das absolut ungefährlich und in der Handhabung problemlos anwendbar ist.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3.3 – Ausschnitt: Schematische Darstellung aus dem Task „Sparlampe“

Die Kriterien an die Testkonstruktion werden hier nicht weiter ausgeführt, sie dienen lediglich als Orientierung. Eine wesentliche Einschränkung bei dieser Annäherung stellte u.a. die kurze pro Testklasse zur Verfügung stehende Zeit von 45 Minuten dar. Es muss festgehalten werden, dass der untersuchte Experimentiertest daher keinen Anspruch auf einen umfassenden wissenschaftlichen Zugang zum Thema „Experimentierfähigkeit“ erheben kann. Wichtige andere Aspekte aus einem umfassenden Kompetenzmodell sind nicht umgesetzt. Dennoch wäre ein vom Fachwissenstest signifikant abweichendes Testergebnis ein wichtiger Hinweis darauf, dass durch den Einsatz von Experimentiertests allenfalls Kompetenzen erfasst werden, welche mit einem traditionellen, ausschliesslich schriftlichen Test verborgen bleiben.

Dass mit dem praktischen Handeln in einem Experimentiertest andere Kompetenzen angesprochen werden, scheint indessen unbestritten. Diese Abgrenzung des Experimentiertests zum Fachwissenstest wurde durch eine kompetenzorientierte Itemanalyse der beiden Tests untersucht. Dabei wurde jedes Item einem der drei für die beiden Tests relevanten Handlungsaspekte des Schweizerischen Kompetenzmodells HarmoS (EDK 2011) zugeordnet. Es sind dies die Handlungsaspekte "Fragen und untersuchen", "Informationen erschliessen“, sowie "Ordnen, modellieren, strukturieren". Die durchgeführte Itemanalyse stützt die beabsichtigte Abgrenzung zum Fachwissenstest: Der Handlungsaspekt "Fragen und untersuchen" hat im Experimentiertest das höchste Gewicht, kommt dagegen im Fachwissenstest nicht vor (vgl. Abb. 3.4).

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3.4 – Kompetenzorientierte Handlungsaspekte und Niveaus in beiden Testformen

Des Weiteren hat die Itemanalyse gezeigt, dass auch der verwendete Experimentiertest nicht ohne Einbezug von Fachwissen auskommt: 9 der 30 konstruierten Items werden dem Handlungsaspekt „Ordnen, modellieren, strukturieren“ zugeordnet. Dieser Aspekt kann unter „Fachwissen anwenden“ subsumiert werden (vgl. Börlin et al 2009).

3.3. Testkonstruktion und Zielsetzung

Der Problemkreis rund um die Adaption der Aufgabenstellung bei praktischen Experimentiertests ist im fachdidaktischen Umfeld breit rezipiert und wissenschaftlich bearbeitet. Vor allem das Dilemma, dass zwar tätiges Handeln der Probandinnen und Probanden evaluiert werden soll, dass aber einerseits die Aufgabenstellungen selbst und anderseits die Beantwortung der gestellten Fragen meist textbasiert sind, wirft grundlegende Fragen auf. Was heisst „verständlich formuliert“ in Bezug auf die Formulierungen der Experimentieraufgaben? Was bedeutet es, wenn die getesteten Lernenden „nicht drauskommen“? Und was bedeuten die daraus resultierenden Anforderungen für das Format der Experimentieranleitungen? Schon mit dieser aufgeworfenen Frage wird klar: Es kann sich bei Aufgaben in Experimentiertests nie wirklich um offene Problemstellungen handeln. Vielmehr geht es genau hier um „nachempfundenes Handeln“ nach Anleitung. Anders ist eine für die ProbandInnen vergleichbare Ausgangslage zu Testzwecken auch kaum vorstellbar; schliesslich ist der Vergleich von Schülerleistungen auch bei Experimentiertests das Ziel.

„So scheinen beispielsweise grafische oder bildliche Informationen sowie kurze statt lange Informationstexte eine Experimentieraufgabe zu vereinfachen. Ebenso scheint das Markieren einer Antwort leichter zu sein als das Zeichnen der Lösung oder das Bezeichnen bzw. Beschreiben der Lösung.“ (Gut 2010, 245)

stellen Gut et al im Zusammenhang mit einer eingehenden Itemanalyse für die Formulierung von Bildungsstandards[5] fest. Es bleibt anzumerken, dass auch mit aufwändigen und umfangreichen Verfahren die Validierung von Kompetenzmodellen ein höchst schwieriges Unterfangen bleibt.

„Die Validierung eines Kompetenzmodells ist ein langwieriger, umfassender und kaum abschliessbarer Prozess. Im HarmoS-Projekt konnten davon erste Schritte geleistet werden. Dazu sind auch Erfahrungen zu zählen, die im Verlaufe der in der Praxis breit abgestützten Bearbeitung des Modells und seiner Konkretisierung und Illustration in Aufgaben sowie mit den auf die Erfassung komplexer Kompetenzen gerichteten Experimentiertests gewonnen wurden.“ (Ramseier, Labudde, Adamina 2011)

Ramseier et al machen deutlich, dass erst die praktische Anwendung von konkreten Aufgabenstellungen im Umgang mit Experimentiertests über die zu erwartende Aussagekraft entscheiden kann. Womit der alltägliche Unterricht in der Schulpraxis angesprochen ist.

Im Zusammenhang mit dem Einsatz von Experimentiertests stellt sich zudem die Frage, welche Kompetenzen mit welchen Zielsetzungen überprüft werden können. Damit verbunden drängt sich wiederum die Frage auf, was mit dem Experimentieren als Unterrichtsform angestrebt wird. Wozu wird im naturwissenschaftlichen Unterricht überhaupt experimentiert? Diese Frage ist bei der Testkonstruktion einerseits und anderseits bei der Verwendung der erhobenen Daten zwecks Generierung von Forschungsbefunden zentral.

[...]


[1] PISA: Akronym von “Programme for International Student Assessment“, ein Instrument für internationale Schulleistungsuntersuchungen der Organisation für wirtschaftliche Zusammenarbeit und Entwicklung OECD, durchgeführt seit 2000.

[2] Eine Delphi-Studie ist ein systematisches, mehrstufiges Befragungsverfahren bzw. eine Schätzmethode, die dazu dient, zukünftige Ereignisse, Trends und technische Entwicklungen möglichst gut einschätzen zu können. Der Name stammt aus dem antiken Orakel von Delphi.

(Quelle: http://de.wikipedia.org/wiki/Delphi-Studie)

[3] TIMSS: Akronym für T hird I nternational M athematics and S cience S tudy. Eine international vergleichende Schulleistungsuntersuchung, die von der International Association for the Evaluation of Educational Achievement (IEA) durchgeführt wurde.

[4] Berechnung einer Kombination ohne Wiederholung:

mit mögliche Kombinationen mit 3 aus insgesamt 6 Tasks.

[5] Im Jahr 2008 wurden in der Schweiz im Zusammenhang mit HarmoS (Bildungsprojekt Harmonisierung der obligatorischen Schule) mit rund 1500 Schülerinnen und Schülern Experimentiertests durchgeführt. Dies geschah mit dem Ziel, ein Kompetenzmodell für den naturwissenschaftlichen Unterricht zu validieren. Mittlerweile sind die Bildungsstandards in der Schweiz verabschiedet (vgl. EDK 2011).

Details

Seiten
115
Jahr
2012
ISBN (eBook)
9783656259244
ISBN (Buch)
9783656259930
Dateigröße
32.9 MB
Sprache
Deutsch
Katalognummer
v196626
Institution / Hochschule
Universität Basel – Forschungs- und Studienzentrum für Pädagogik
Note
5.5 - sehr gut
Schlagworte
QuIP Physikunterricht Experimentiertest Naturwissenschaftsdidaktik Gender und Physik

Autor

Teilen

Zurück

Titel: Experimentiertests im trinationalen Vergleich