GDM-Tagung 1999 in Bern; Vortragskurzfassung zum Vortrag am 5.3.1999
Konstruktion von Aufgaben zur Lernerfolgskontrolle
 
Inhalt
1 Hinführung
2 Einleitung
3 Gesichtspunkte für die Aufgabenauswahl und -konstruktion
4 Ein Beispiel für eine klassische Aufgaben - und die Lösung eines Schülers
5 Drei Beispiele aus TIMSS
6 Weitere Beispiele von Prüfungsaufgaben und ihre Approximation durch andere Aufgabenformen
7 Vergleich von Aufgaben zur Prüfung von Teilqualifikationen mit "klassischen" Aufgaben
8 Aufgabenform und Lernorganisation
9 Verweise
 

1 Hinführung

Wer von den vier "Aufgaben" des Typs

            0,26+0,072  = ?            3,5-2,67 = ?             0,4*0,7  = ?           3:0,2 = ?

drei (oder auch vier) ohne zeitliche Begrenzung richtig lösen kann, "beherrscht" in der Nomenklatur des BWT (Berufswahltest der deutschen Arbeitsverwaltung) das Dezimalrechnen [1]. Ein Auto mit nur drei funktionsfähigen Rädern würde dagegen den deutschen TÜV (Technischer Überwachungsverein) nie passieren und aus dem Verkehr gezogen. Die Werkstatt, die ein solches Fahrzeug für den Straßenverkehr freigeben würde, müßte mit Bestrafung rechnen.
 

2 Einleitung

Der TÜV prüft Autos und entscheidet nach klaren Kriterien, die allgemein bekannt und akzeptiert sind. Für die Beschreibung der Ergebnisse des Mathematikunterrichts kennt man im Gegensatz zum angelsächischen Bereich im deutschen Sprachraum keine derartigen Kriterien - und bisher kaum Konsequenzen. Die Themen Aufgabenanalyse und Aufgabenkonstruktion bergen eine großes Potential für Zeitersparnis, Korrekturgerechtigkeit, sichtbaren Lernerfolg, Unterrichtsreform, ... . Trotzdem sind sie Stiefkinder der Mathematikdidaktik.

TIMSS [2] ist der erste externe Leistungsvergleich für den Mathematikunterricht. Diese Studie hat erstmals im großen Maßstab in die Öffentlichkeit getragen, was Insider schon längst gewußt hatten:
 
 

Bei vielen Schülern erreicht der Mathematikunterricht extrem wenig.
 

Drei zentrale Fragen harren der Untersuchung:

    - Liegt der Fehler beim üblichen Unterricht des Fachs Mathematik? (Siehe dazu auch [3])
    - Gibt es Grenzen der Lernfähigkeit der Schüler? (Siehe dazu auch [4])
    - Wie sehen die Instrumente zur Messung des Lernerfolgs aus und was leisten sie?

Die dritte Frage ist Thema dieses Beitrags. Wir beginnen mit einer diffusen Antwort: Schüler arbeiten, sowohl in der Lernphase als auch in der Prüfungsphase, an irgendwelchen Aufgaben. Die Bearbeitung wird irgendwie bewertet. Ist Präzisierung möglich?
 

3 Gesichtspunkte für die Aufgabenauswahl und -konstruktion

Die Aufgaben stehen im einfachsten Fall im Schulbuch oder sie werden kunstvoll vom Lehrer entwickelt. Dabei kann unter anderem das Folgende einbezogen werden:

- fachliche Anforderungen,
  Welche mathematische Leistung wird gefordert?
- fachliche Voraussetzungen für die Bearbeitung,
   In wie weit gehen andere mathematische Qualifikationen in die Bearbeitung ein?
- allgemeine kognitive Voraussetzungen für die Bearbeitung,
  Was wird an Beharrlichkeit, Konzentrationsfähigkeit, Sprachverständnis ... verlangt
- Verbindung mit vorausgegangenen Unterweisungen oder Studien,
   In welcher Weise haben Unterricht oder Selbststudium auf die Anforderungen vorbereitet?
- Zeitaufwand für die Bearbeitung,
   Wie lang braucht der Korrektor selbst für eine Bearbeitung, die er mit sehr gut bewerten würde; wie viel von der Arbeitszeit entfällt dabei unmittelbar auf das mathematische Problem, wie viel auf Hilfstätigkeiten, Darstellungsaufwand, ... ?
- Korrekturfreundlichkeit,
  Wird individuell in einem Heft gearbeitet oder verringert ein vorstrukturierter Bogen die Suchzeiten nach Zwischenergebnissen. (Ein Lehrer, der Klassenarbeiten in Hefte schreiben läßt, verwendet einige Tage seiner Lebensarbeitszeit auf das Blättern in den Heften.) Eine Korrektur ist um so anstrengender, je mehr verschiedene Parameter vom Bearbeiter der Aufgaben festgelegt werden können.
- Zeitaufwand für die Korrektur,
  Dieser hängt mit der Korrekturfreundlichkeit zusammen. Eine gute Vorstrukturierung kann den Zeitaufwand für die Korrektur schrumpfen lassen.
- Eignung für Selbstkontrolle,
  Eine entsprechend vorstrukturierte Arbeit kann mit Hilfe eines Lösungsblatts vom Bearbeiter selbst vollständig ausgewertet werden. Die Korrektur ist transparent und nachvollziehbar. Aufgaben, die sich für Selbstkontrolle eignen, schaffen Freizügigkeit in der Lernorganisation (s.u.).

In der Praxis werden diese Gesichtspunkte bei Aufgabenzusammenstellungen selten vollständig berücksichtig. Häufig wird nicht einmal analysiert, welche Teilqualifikationen für die Bearbeitung einer konkreten Aufgabe erforderlich sind, und ob die Schüler über alle diese Teilqualifikationen verfügen. Im Hintergrund steht die Hypothese, daß der vorausgegangene Unterricht diese Teilqualifikationen bereitgestellt hat. Tatsächlich gibt es in fast jeder Klasse Schüler, die diese Hypothese zu bestätigen scheinen. Sind die anderen einfach nur schicksalhaft "schlechte" Schüler?

Bei den meisten Aufgaben wird eine Vielzahl von Teilqualifikationen gebündelt. Eine auch nur annähernd transparente Bewertung ist deshalb nur bei einer Form der Bearbeitung möglich: Bei der Bearbeitung, die vollständig den Erwartungen des Aufgabenstellers entspricht. In allen anderen Fällen ist es schwierig, den Lernerfolg zu bewerten. Insbesondere ergeben sich kaum nutzbare Rückmeldungen für therapeutische Maßnahmen. Einige Beispiele sollen dies konkretisieren.
 

4 Ein Beispiel für eine klassische Aufgaben - und die Lösung eines Schülers

Beispiel 4.1   Klassenarbeit (5. Schuljahr 1970/71; Großstadtklasse, Hauptschule; 19.11.1970)

1.) Schreibe in römischen Ziffern 936, 1 312, 989!
2.) Schreibe in arabischen Ziffern MCDLXXIV, MCCXLI!
3.) Addiere 2 654 und 1 346! Multipliziere dann die Summe mit 1 000!
4.) Bauer Mäckler verkauft ein Rind zu 1 678 DM und acht Ferkel zu je 67 DM Vom Erlös kauft er einen Häcksler. 136 DM behält er übrig. Was kostet die Maschine?
5.)Ein Händler kauft zwei teure und drei billige Fahrräder für zusammen 694 DM. Was kostet eines der billigen Fahrräder, wenn ein teures Fahrrad 158 DM kostet?
 
Bei der hervorgehobenen Aufgabe wurden nach den damaligen ungeschriebenen Gesetzen drei Schritte der Bearbeitung erwartet: Addition, Multiplikation, Ergebnissatz. Die Problematik wird deutlich, wenn wir eine entsprechende Schülerbearbeitung betrachten (ausführliche Diskussion in [5], S. 26 bis 45, 128/129):


 Zwei Tatsachen stehen außer Zweifel:
 
 

Schüler liefern auch solche Bearbeitungen. 
Die Bewertung dieser Bearbeitung ist schwierig.
Ungenügend und sehr gut können wir ausschließen. Ist indessen diese Schülerlösung mangelhaft, ausreichend, befriedigend oder sogar gut? Jede dieser Bewertungen ist bei zahlreichen Versuchen [5; S 26 ff.] vorgekommen. Gibt es Abzug für sprachliche Mängel in der Ergebnisformulierung ("Der 1000 sten Teil")? Hat der Schüler ein Zwischenergebnis formuliert und dieses dann mit dem Endergebnis verwechselt? Hätte er 4 000 mit 1 000 multiplizieren können oder nicht? Hat er vielleicht nicht mehr präsent, was multiplizieren heißt? Ist seine Bearbeitung besser oder schlechter als die eines Mitschülers, der einfach nur "Ergebnis: 4 000 000" hingeschrieben hat (er könnte im Kopf gerechnet haben!)?

Die Schwierigkeiten in der Bewertung haben wir uns bei dieser Aufgabe dadurch eingehandelt, daß der Schüler einen größeren Freiraum für sein Vorgehen erhalten hat. Je mehr Freiraum bei der Bearbeitung desto größer die Unsicherheit der Bewertung.
 

5 Drei Beispiele aus TIMSS

An Aufgaben aus TIMSS seien beispielhaft drei Aufgaben mit zunehmendem Freiraum der Bearbeitung wiedergegeben:

Beispiel 5.1: Kein Freiraum [6]; es kann nur A, B, C oder D angekreuzt werden:
 
 

Das Herz eines Menschen schlägt in der Minute 72mal. Wie oft 
schlägt es bei diesem Tempo ungefähr in einer Stunde? 
    A. 420 000 
    B.   42 000 
    C.    4 200 
    D.       420 
 
Bei Aufgaben dieser Art sind Bewertungsprobleme nahezu ausgeschlossen. Selbstkontrolle ist problemlos. Der Zeitaufwand für die Kontrolle ist minimal. (Kritik an Formulierungsschwächen interessiert in unserem Zusammenhang nicht.)

Beispiel 5.2: Geringer Freiraum [7]; der Rechenalgorithmus liegt weit gehend fest::
 
 

Multipliziere: 0,203*0,56 = 
 

Antwort:  ____________________________________ 
 

 
Hier bedarf es einer Vereinbarung darüber, ob Teilergebnisse Berücksichtigung finden sollen oder nur das richtige Ergebnis akzeptiert wird. Selbstkontrolle ist möglich. Der Zeitaufwand für die Korrektur bleibt erträglich.

Beispiel 5.3: Größerer Freiraum [8]; Es gibt zahlreiche verschiedene Lösungswege und Möglichkeiten, diese aufzuschreiben:
 
 

In zwei Kisten befinden sich 54 kg Äpfel. Die zweite Kiste wiegt 12 kg mehr als die erste Kiste. Wieviele Kilogramm Äpfel sind in jeder Kiste? 
Schreibe Deine Lösungsschritte auf. 
 
Bei Aufgaben dieser Art gibt es einen außerordentlich großen Bewertungsspielraum zwischen ganz richtig und ganz falsch. Wie dieser Spielraum genützt wird, bleibt subjektiv und ist sogar zeitabhängig. Selbstkontrolle ist fast unmöglich, da ein Lösungsblatt nur einen Teil der möglichen Lösungswege aufführen kann. Der Zeitaufwand für das Aufsuchen und Bewerten der Lösungsschritte ist erheblich. Eine sachgerechte Korrektur ist daher mühsam und läßt Objektivität vermissen.

Leider war es bis zum Abschluß dieses Beitrags nicht möglich, vom Max-Planck-Institut für Bildungsforschung in Berlin eine Auskunft darüber zu erhalten, ob die TIMSS-Bedingungen eine anonyme Offenlegung von Schülerlösungen dieser Aufgabe und deren Korrektur erlauben.

Lassen sich die TIMSS-Aufgaben mit  konventioneller Lernerfolgsmessung vergleichen? Das zweite und das dritte Beispiel entspricht den allgemein üblichen Aufgabenformulierungen.

Das erste Beispiel könnte weit verbreitete Vorurteile gegen Auswahlantwortaufgaben stärken. Beim verwendeten Typ 1 aus 4 (4 Antwortalternativen werden angeboten; es ist bekannt, daß genau eine davon richtig ist.) sind  diese nicht ganz unberechtigt. Ab x aus 5 liegt die Ratewahrscheinlichkeit so niedrig, daß sie vernachlässigbar ist (insbesondere, wenn falsche Auswahlen bis zur Gesamtsumme 0 mit -1 Punkt bewertet werden).
 
 

6 Weitere Beispiele von Prüfungsaufgaben und ihre Approximation durch andere Aufgabenformen

Beispiel 6.1 (Aufgabe analog zu einer Aufgabe der zentralen Klassenarbeit (1998; Gymnasium), die in Baden-Württemberg am Ende von Klasse 10 geschrieben wird; die Veröffentlichung der Originalaufgabe ist nicht gestattet.)
 

Ein Mammutbaum ist zu einem bestimmten Zeitpunkt 18 m hoch; ein Jahr später hat er eine Höhe von 20,5 m erreicht. 
a) Wie hoch wäre der Baum bei Voraussetzung exponentiellen Wachstums 4 Jahre nach Beginn der Beobachtung (gerundet auf 0,5 m).Wann wäre er bei dieser Annahme etwa 75 m hoch? 
b) Mammutbäume werden 75 m hoch. Die logistische Formel für die Wuchshöhe W(x) nach x Jahren 
               W(x+1) = W(x) + k*W(x)*(75-W(x)) 
beschreibt das Wachstum besser. Welche Wuchshöhe hat der Baum nach dieser Formel 4 Jahre nach Beginn der Beobachtung zu erwarten?
10 Punkte
Für die Bearbeitung sollen ohne nähere Spezifizierung bis zu 10 von insgesamt 40 Punkten für vier Aufgaben vergeben werden. Die Aufgabenteile A und B sind voneinander unabhängig.

Für die Korrektur gilt in weit höherem Maß, was bereits zu Beispiel 4.1 angeführt wurde. Ginge es auch anders? Im Folgenden sollen die fachlichen Anforderungen der Aufgabe modularisiert und zum Teil auf weniger offene Aufgabenformen abgebildet werden.

Dazu eine Analyse: Implizit gefordert werden
- die Analyse eines (Pseudo-)Sachtextes (der exponentielle Ansatz wird vorgegeben),
- die Kenntnis einer Formel für das exponentielle Wachstum,
- die passende Zuordnung von Variablenwerten aus den Angaben des Textes,
- die Fähigkeit zur numerischen Bestimmung der Konstanten in der Formel,
- die Anwendung der Formel zu einer Extrapolation,
- die zahlenmäßige Berechnung der Zeitvariablen im Exponenten,
- die Fähigkeit zur numerischen Bestimmung einer Konstanten aus einer linearen Gleichung "komplizierten Aussehens",
- die Anwendung dieser Formel zu einer Extrapolation,
- Die Fähigkeit, diese Einzelqualifikationen zu reihen und zu verknüpfen.

Die meisten dieser Forderungen werden explizit erfaßt durch die folgenden Aufgaben

6.1a Welche Aussagen stimmen mit dem Text überein? Kreuze an
    O Mammutbäume werden 75 m hoch.
    O Mammutbäume wachsen exponentiell.
    O Das exponentielle Wachstum wird durch die logistische Formel beschrieben.
    O Der Mammutbaum wächst jedes Jahr um 2, 5 m.
    O Nach vier Beobachtungsjahren kann man die Endhöhe eines Mammutbaums berechnen.

6.1b Berechnen Sie, soweit möglich, die Werte a und b aus den Gleichungen

    4,1 = 3,6 + a•3,6•(15 -3,6)
        a =
    ea =  41/36
        a =
    3a + 2b = 9   b/a = 1/3
        a =                                b =
    eb+2 = 15
        b =
 
6.1c Entnehmen Sie aus dem Text, soweit ohne Rechnung möglich, die folgenden Werte und tragen Sie diese ein:
    W(x) =
    W(0) =
    W(1) =
    W(x+1) =
    W(3) =
    W(x+3) =
    W(4) =
    W(x+4) =
    W(75) =
6.1c hätte man auch als Tabelle vorgeben können.

6.1d Welche der folgenden Formeln für W beschreiben exponentielles Wachstum (k, x und E sind reelle Zahlen):
    O W(x+1) = W(x)k+1
    O W(x+1) = W(x) + k*W(x)*(E-W(x))
    O W(x) = ek*(x+4)
    O W(x) = x*E*ek
    O W(x+1) = Eek*(x+4)

Den vorstehenden Aufgaben ist gemeinsam
- Die erwarteten Anworten sind eindeutig bestimmt.
    Es gibt - praktisch - keine Unsicherheiten bei der Bewertung.
- Der Platz für jede Antwort ist eindeutig bestimmt.
    Suchzeiten bei der Korrektur sind minimal.
- Jede Aufgabe erfordert zur Bearbeitung eine definierbare Teilqualifikation.
    Diese kann bei Bedarf in Unterqualifikationen aufgeschlüsselt werden.

Alle diese Aufgaben sind geeignet zur Selbstkontrolle (und damit auch für eine automatisierte Auswertung durch den Rechner).

Natürlich entsteht Beratungsbedarf, wenn die vorgegebene Lösung nicht mit der durch den Schüler gefundenen Lösung übereinstimmt. Dieser Beratungsbedarf entsteht aber auch nach einer Korrektur einer ausführlichen Aufgabenlösung durch Sachverständige. Er ist dann nicht so leicht zu erfüllen und wird in der Paxis vielfach auch nicht befriedigt.
 
Beispiel 5.2 (Aufgabe analog zu einer Aufgabe der zentralen Reifeprüfung in Baden-Württemberg, Grundkurs Mathematik/Analysis, 1998;  die Veröffentlichung der Originalaufgabe ist nicht gestattet.)
 
 

Der Querschnitt eines Flußtals wird durch einen Kurvenabschnitt des Schaubilds von f (f(x)=-1/8*x3 + 3/4*x2 mit reellem x) zwischen dem Hochpunkt H und dem Punkt P (-2/f(-2)) beschrieben. Von H aus setzt sich das Gelände horizontal fort, von P aus in Richtung der Geraden durch P und den Punkt Q (3/f(3)). 
a) Bestimmen Sie gemeinsame Punkte des Schaubilds mit den Koordinatenachsen, Hoch-, Tief- und Wendepunkte. 
Wie heißt die Gleichung der Geraden PQ. 
Zeichnen Sie den Talquerschnitt mit dem angrenzenden Gelände in einem geeigneten Koordinatensystem. 
Bei Hochwasser wird der Punkt P erreicht. Welchen Flächeninhalt hat dann der mit Wasser gefüllte Teil des Tals? 
b) Von H soll ein geradliniger Leitungstunnel gebohrt werden, der in 
B(u, f(u)) mit 0<u<4 mündet. Wählen Sie B so, daß der Tunnel maximales Gefälle bekommt. 
c) Bei einer Trockenheit sinkt der Wasserspiegel bis auf R(-1/f(-1)). Ab welcher Höhe senkrecht über H sieht man diesen Punkt?
Für die Aufgabenteile (a), (b) und (c) sollen 11, 9 und 10 Verrechnungs- punkte vergeben werden.
Auch hier eine Analyse der Anforderungen:
-  Analyse eines (Pseudo-)Sachtextes (Kenntnis der Grundbegriffe),
-  Kenntnis der Verfahren der Kurvenuntersuchung für ganz-rationale Funktionen,
        (Schnittpunkt mit den Achsen, Untersuchung auf Hoch-, Tief- und Wendepunkte)
- Zeichnen eines Schaubilds zu einer Wertetafel,
- Aufstellen von Geraden- und Tangentengleichungen; Bestimmung des Schnittpunkts von zwei Geraden,
- Bestimmung einer Stammfunktion für ganz-rationale Funktionen und Berechnung eines bestimmten Integrals,
- passende Zuordnung von Variablenwerten aus den Angaben des Textes,
- Fähigkeit, diese Einzelqualifikationen zu reihen und zu verknüpfen.
 
Wir könnten wieder entsprechend dem Beispiel 6.1 Kontrollfragen für die einzelnen Teilqualifikationen formulieren.
 

7 Vergleich von Aufgaben zur Prüfung von Teilqualifikationen mit "klassischen" Aufgaben

Die Vorteile von Aufgaben zur Prüfung von Teilqualifikationen mit eindeutiger Antwort liegen auf der Hand:

Nur fortgeschrittene Lerner können ihre Arbeitsergebnisse auch bei komplexeren Aufgaben anhand einer Musterlösung selbst korrigieren. (Zu den baden-württembergischen Abitursaufgaben in Physik erhalten die Lehrer neuerdings Musterlösungen!)

Nachteile sind:

8 Aufgabenform und Lernorganisation

Wird der Lernerfolg mit klassischen Aufgaben überprüft, so ist für diese Arbeit ein qualifizierter Lehrer unentbehrlich. Nur er kann im Zweifelsfall - wenn auch subjektiv - entscheiden, in welchem Umfang eine solche Aufgabe bearbeitet ist. Nur ein Experte kann die "Verrechnungspunkte" zuweisen.

Experteneigenschaft ist auch erforderlich, wenn der Lehrer die einzige Informationsquelle ist. Freilich hat der fachliche Informationsvorsprung des Lehrers seine Bedeutung verloren und in Teilgebieten (z.B. Computer) existiert er in der Regel nicht mehr. Lehrer, deren Selbstverständnis von Informations- und Prüfungsmonopol (Bewertungsmonopol) lebt, sind eigentlich ein Anachronismus. (Das heißt nicht, daß dieser Anachronismus noch ein langes und zähes Leben haben kann.)

Wenn der Lernende freien Zugang zu den Informationsquellen hat und seinen Lernerfolg mit Aufgaben, die für Selbstkontrolle geeignet sind, selbst korrekt einschätzen kann, ist er in der Lage, den weitaus größten Teil seines Lernens selbst zu organisieren. Dies eröffnet Lernmöglichkeiten, die weitaus effektiver sind als das Lernen in der inhomogenen Jahrgangsklasse - mit neuen Aufgaben für den Lehrer!
 
Verweise

[1] H. Hufstedt, Weniger Basisqualifikationen, bildung&wissenschaft 12, 1999, S. 14/15

[2] Materialien zur Bildungsforschung 60, http://192.109.48.239/TIMSS_II/Testaufgaben/Math_P2.PDF

[3] F. Nestle, Lernen - nur mit Lehrer?, http://home.t-online.de/home/nsoft/med.htm

[4] F. Nestle, Zur optimalen Bildungsdauer - Ausschnitte aus einer Simulation, http://home.t-online.de/home/nsoft/ler.htm

[5] F. Nestle, Alternativen im Mathematikunterricht, Lexika Verlag, München 1986

[6] http://192.109.48.239/TIMSS_II/Testaufgaben/Math:P2.PDF S.62 P13; siehe

[7] http://192.109.48.239/TIMSS_II/Testaufgaben/Math:P2.PDF S. 75 M8; siehe

[8] http://192.109.48.239/TIMSS_II/Testaufgaben/Math:P2.PDF S.34 T1; siehe

Siehe auch Leistungsmessung