14 Stochastik

Ziele

  • Sie wissen um die Bedeutung des Modellierens bei stochastischen Situationen.
  • Sie kennen verschiedene Möglichkeiten, stochastische Begriffe oder Verfahren zu visualisieren, insbesondere zu allgemeinen stochastischen Vorgängen (z. B. Zufallsexperimente), zur Kombinatorik und zu bedingten Wahrscheinlichkeiten.

Material

Literaturempfehlungen

  • Krüger et al. (2015): Didaktik der Stochastik in der Sekundarstufe I
  • Tietze et al. (2002): Mathematikunterricht in der Sekundarstufe II. Band 3: Didaktik der Stochastik

14.1 Stochastische Vorgänge

14.1.1 Modellierungsstruktur

Grundsätzlich ist es Aufgabe der Stochastik, reale Prozesse zu modellieren, um diese mit mathematischen Mitteln, also einem theoretischen Modell, greifbar (und bearbeitbar) zu machen. Dazu ist es normalerweise notwendig, die reale Situation erst einmal zu vereinfachen und in ein Realmodell zu überführen (siehe Abbildung 14.1). Dieses Vorgehen ist nicht spezifisch für die Stochastik – jedoch ist der Zwischenschritt des Realmodells hier aufgrund der vielfältigen Modellierungsmöglichkeiten von besonderer Bedeutung.

Modellierungsstruktur in der Stochastik (Krüger et al., 2015, S. 13)

Abb. 14.1: Modellierungsstruktur in der Stochastik (Krüger et al., 2015, S. 13)

Aufbauend auf diese Struktur (die »nicht als expliziter Gegenstand des Stochastikunterrichts aufzufassen« ist, Krüger et al., 2015, S. 13) können Sie Ihre Diskussionen im Unterricht leiten und Schwierigkeiten der Schülerinnen und Schüler besser einordnen, z. B.:

  • Wenn ein Würfel geworfen wird (reale Situation) und man die Wahrscheinlichkeit für eine Augenzahl angibt (theoretisches Modell), geht man davon aus, dass der Würfel aus sechs identischen Seiten besteht und in sich homogen ist (Realmodell). Mögliche Fragen, die auf eine solche Denkweise hinarbeiten, könnten sein: Welche Annahmen triffst du? Welche Eigenschaften muss der Würfel haben, damit du so rechnen darfst?

  • Wenn erstmals Zufallsgeräte (übrigens auch ein Begriff auf der Ebene der Realmodelle) genutzt werden, muss eine Untergeneralisierung vermieden werden, es sollten also frühzeitig auch nicht-Laplace-Geräte eingesetzt werden, wie Reißzwecken, Quader, sogenannte Riemer-Würfel (Riemer, 1988) oder auch Würfel-Schweine (Wikipedia, o. J.).

  • Wenn eine Schülerin oder ein Schüler nicht in der Lage ist, für das Ziehen einer Herz-Karte aus einem Skatblatt die Wahrscheinlichkeit anzugeben, sollten Sie als Lehrkraft herausfinden, auf welcher Ebene Schwierigkeiten bestehen. Wird die reale Situation nicht verstanden (weil z. B. die Spielkartenfarben oder der Begriff Skatblatt unbekannt sind)? Bestehen Schwierigkeiten im Aufstellen eines Realmodells (dass also das Ziehen jeder Karte mit derselben Wahrscheinlichkeit verbunden ist und dafür die Anzahl der relevanten Karten bestimmt werden muss)? Oder sind Defizite in der Theorie verortet (weil etwa nicht die Laplace-Formel für die Berechnung der Wahrscheinlichkeit angewandt werden kann oder gar Schwierigkeiten bei der Division bestehen)?

14.1.2 Prozessbetrachtung

Zur Unterstützung der Schülerinnen und Schüler in der Beschreibung stochastischer Vorgänge schlagen Krüger et al. (2015, 14 f.) die Nutzung einer Prozessbetrachtung vor (siehe Abbildung 14.2).

Vorgangsbetrachtung nach Krüger et al. (2015, S. 16)

Abb. 14.2: Vorgangsbetrachtung nach Krüger et al. (2015, S. 16)

Es handelt sich hierbei um eine schematische Darstellung, wobei vier wesentliche Fragen relevant sind (Krüger et al., 2015, S. 15):

  1. »Welcher Vorgang läuft mit welchen Objekten oder Personen ab?«
  2. »Welches Merkmal interessiert mich? Wie kann ich das Merkmal erfassen?«
  3. »Welche Ergebnisse sind möglich?«
  4. »Welche Bedingungen beeinflussen den Vorgang?«

Das Schema und die Leitfragen können im tätigkeitstheoretischen Sinne als Orientierungshilfe aufgefasst werden. Ein solches Vorgehen ist dabei sowohl für Fragen der Wahrscheinlichkeitsrechnung als auch für die Beschreibung von Statistiken möglich, womit auch beides als Teildisziplinen der Stochastik sichtbar werden kann. Abbildung 14.3 zeigt exemplarisch zwei derartige Prozessbetrachtungen.

Prozessbetrachtungen für zwei stochastische Vorgänge

Abb. 14.3: Prozessbetrachtungen für zwei stochastische Vorgänge

14.2 Kombinatorik

Eine Herausforderung kombinatorischer Fragestellungen besteht für Schülerinnen und Schüler oftmals in der korrekten Zuordnung zwischen kombinatorischer Situation und dem entsprechenden mathematischen Modell. Bei fehlendem Verständnis kann es daher in der Unterrichtsrealität schnell zum Raten kommen, welches der vier Modelle aus dem Tafelwerk gewählt wird (vgl. Tabelle 14.1).

Tab. 14.1: Typische Darstellung von Kombinatorik-Modellen in Tafelwerken
mit Wiederholung ohne Wiederholung
Variation mit Beachtung der Reihenfolge \(n^k\) \(\frac{n!}{(n-k)!}\)
Kombination ohne Beachtung der Reihenfolge \(\binom{n+k-1}{k} = \frac{(n+k-1)!}{k!(n-1)!}\) \(\binom{n}{k}=\frac{n!}{k!(n-k)!}\)

Es soll hier nicht diskutiert werden, wie die entsprechenden Formeln begründet werden können oder in welcher Reihenfolge sich welche Einführung anbietet. Vielmehr soll überlegt werden, welche Unterstützungsmöglichkeiten Schülerinnen und Schülern geboten werden können, um verständnisfördernd Situationen den entsprechenden mathematischen Modellen zuordnen zu können. Im Prinzip sind diese Unterstützungsmöglichkeiten selbst wieder Modelle als »Brücke zwischen einer stochastischen Realsituation und dem formalen Modell« (Tietze et al., 2002, S. 197).

Zunächst gilt in allen vier Fällen: Aus einer Gesamtheit von \(n\) Objekten werden (unter bestimmten Voraussetzungen) \(k\) Objekte ausgewählt und (unter bestimmten Voraussetzungen) auf Plätze verteilt. Die Voraussetzung der Auswahl bestimmt, ob es sich um einen Vorgang mit oder ohne Wiederholung handelt. Die Voraussetzung der Verteilung ist mit oder ohne Beachtung der Reihenfolge.

Die Dichotomie »mit Beachtung der Reihenfolge« – »ohne Beachtung der Reihenfolge« kann auch über die Frage »Ist es relevant, ob ich im Nachhein meine Objekte umsortiere oder nicht?« betrachtet werden. Eine Repräsentation sollte diese Relevanz der Reihenfolge unterstützen. Abbildung 14.4 zeigt einen entsprechenden Vorschlag.

Repräsentation für Auswahl mit (links) und ohne (rechts) Beachtung der Reihenfolge

Abb. 14.4: Repräsentation für Auswahl mit (links) und ohne (rechts) Beachtung der Reihenfolge

Die Dichotomie »mit Zurücklegen« – »ohne Zurücklegen« kann alternativ auch als »mit Wiederholung« – »ohne Wiederholung« aufgefasst werden. Darf nicht wiederholt werden, ergibt sich schnell, dass \(n\geq k\) gelten muss, da sonst nicht genügend Objekte vorhanden sind, aus denen gewählt wird. Die wählbaren Objekte können also als Ansammlung in einem großen Topf aufgefasst werden, aus dem sie jeweils einmalig gezogen werden können. Bei Wiederholung kann einerseits die Auffassung bestehen, dass die Objekte zurückgelegt werden dürfen (z. B. beim Ziehen bestimmter farbiger Kugeln), andererseits dass das Objekt hinreichend oft verfügbar ist (wenn z. B. Früchte für einen Obstsalat ausgewählt werden oder wenn bei einem Zahlenschloss jeweils die Ziffern 0 bis 9 zur Verfügung stehen). Abbildung 14.5 macht einen Vorschlag, wie dies allgemein repräsentiert werden kann.

Repräsentation für Auswahl ohne (links) und mit (rechts) Wiederholen/Zurücklegen

Abb. 14.5: Repräsentation für Auswahl ohne (links) und mit (rechts) Wiederholen/Zurücklegen

Daraus ergeben sich nun die vier Optionen, dargestellt als Tabelle in Abbildung 14.6.

Tabelle zur Variation/Kombination mit unterstützenden Repräsentationen

Abb. 14.6: Tabelle zur Variation/Kombination mit unterstützenden Repräsentationen

Diese Repräsentation kann nun unterstützen, Realsituationen zu abstrahieren und dann dem entsprechenden mathematischen Modell zuzuordnen.

14.3 Boxplot

Da beim Erstellen eines Boxplots nur mit absoluten Häufigkeiten einer geordneten Messreihe gearbeitet werden muss, bietet sich eine Behandlung auch schon in jüngeren Klassenstufen an. Hierbei treten die Begriffe Median und Spannweite sowie oberes und unteres Quartil auf.

Krüger et al. (2015, S. 123) empfehlen in der Einführung von Boxplots, zunächst auf die Behandlung von Ausreißern zu verzichten und parallel zum Boxplot die Daten als Punktdiagramm darzustellen (siehe Abbildung 14.7).

Boxplot mit Punktdiagramm (Krüger et al., 2015, S. 123)

Abb. 14.7: Boxplot mit Punktdiagramm (Krüger et al., 2015, S. 123)

Abbildung 14.8 zeigt den Screenshot eines virtuellen Arbeitsmittels zur Erkundung von Zusammenhängen am Boxplot, das im Rahmen einer Masterarbeit an der Universität Potsdam entstanden ist (Korn, 2023).

Screenshot des virtuellen Arbeitsmittels zum Boxplot

Abb. 14.8: Screenshot des virtuellen Arbeitsmittels zum Boxplot

Auch bei diesem Arbeitsmittel wird der Boxplot abhängig von der Lage der variierbaren Punkte automatisiert dargestellt. Über weitere Konfigurationen wie das Einblenden des Datensatzes oder das Ausblenden der Daten selbst können vielfältige Aufgaben bearbeitet werden (vgl. Korn, 2023):

  • Verändere den Datensatz so, dass
    • die Box kleiner wird,
    • die linke Antenne ganz lang und die rechte Antenne ganz kurz wird,
    • die rechte Hälfte der Box größer wird, aber der Median gleich bleibt.
  • Erstelle einen eigenen Datensatz, blende ihn aus und lass deinen Partner bzw. deine Partnerin einen passenden Datensatz mit mindestens neun Werten finden, der denselben Boxplot produziert.

14.4 Bedingte Wahrscheinlichkeiten

Bei der Betrachtung von Situationen, in denen bedingte Wahrscheinlichkeiten eine Rolle spielen, haben Schülerinnen und Schüler (und nicht nur die) oftmals die Schwierigkeit, die verschiedenen Bedingungen auseinanderzuhalten, weshalb fehlerhafte Schlüsse gezogen werden (vgl. Binder et al., 2020).

Ist beispielsweise bekannt, dass ein Corona-Test mit 90%-iger Wahrscheinlichkeit eine Person, die an Corona erkrankt ist, auch positiv testet und mit 95%-iger Wahrscheinlichkeit eine Person, die nicht an Corona erkrankt ist, auch negativ testet, so stellt sich die Frage, wie hoch die Wahrscheinlichkeit ist, dass man tatsächlich an Corona erkrankt ist, wenn der Test positiv ausfällt. Um diese Frage zu beantworten, ist es weiterhin noch nötig zu wissen (oder zu schätzen), wie hoch der Anteil tatsöchlich erkrankter Personen in der Gesamtbevölkerung ist. Geht man von einem Anteil von 1% aus, so stellt Abbildung 14.9 eine (nicht maßstäbliche) Vierfeldertafel dieser Situationen dar.

Vierfeldertafel für bedingte Wahrscheinlichkeiten

Abb. 14.9: Vierfeldertafel für bedingte Wahrscheinlichkeiten

Es sind demnach bekannt:

\[\begin{align} P(C) &= 0,\!01 \ \mathrm{(Prävalenz)}\\ P_C(T) &= 0,\!95 \ \mathrm{(Sensitivität)}\\ P_{\neg C}(\neg T) &= 0,\!99 \ \mathrm{(Spezifität)} \end{align}\]

Grundsätzlich gilt als Definition für bedingte Wahrscheinlichkeiten: \[P_B(A) = \frac{P(A\cap B)}{P(B)}\]

Nach dem Satz von Bayes und dem Satz von der totalen Wahrscheinlichkeit gilt: \[P_B(A) = \frac{P(A)\cdot P_A(B)}{P(B)} = \frac{P(A)\cdot P_A(B)}{P(A)\cdot P_A(B)+P(\neg A)\cdot P_{\neg A}(B)}\] Hieran zeigt sich schon, dass Schülerinnen und Schüler Schwierigkeiten haben könnten, wenn sie nicht die hinter den Formeln liegenden Vorstellungen entwickeln, welche Wahrscheinlichkeiten jeweils aufeinander Bezug genommen werden. Geeignete Repräsentationen sollen nun helfen, die Zusammenhänge nachvollziehen zu können. Die Vierfeldertafel aus Abbildung 14.9 ist eine solche. Abbildung 14.10 zeigt, wie die Wahrscheinlichkeiten \(P(C)\), \(P_C(T)\) und \(P_T(C)\) darin jeweils als Anteil einer Teilmengenbeziehung aufgefasst werden können.

Vierfeldertafeln zur Visualisierung der Wahrscheinlichkeiten $P(C)$, $P_C(T)$ und $P_T(C)$

Abb. 14.10: Vierfeldertafeln zur Visualisierung der Wahrscheinlichkeiten \(P(C)\), \(P_C(T)\) und \(P_T(C)\)

Als Repräsentation ebenfalls verbreitet sind sogenannte Doppelbäume, siehe Abbildung 14.11. Auch dort kann nachvollzogen werden, welche Beziehung jeweils betrachtet wird.

Doppelbaum für bedingte Wahrscheinlichkeiten

Abb. 14.11: Doppelbaum für bedingte Wahrscheinlichkeiten

Nach Binder et al. (2020) bietet sich ebenfalls ein Häufigkeitsnetz an, siehe Abbildung 14.12. Gegenüber den bisherigen Darstellungen können in diesem auch direkt die Schnittwahrscheinlichkeiten abgelesen werden.

Häufigkeitsnetz für bedingte Wahrscheinlichkeiten

Abb. 14.12: Häufigkeitsnetz für bedingte Wahrscheinlichkeiten

Als weitere Unterstützungsmöglichkeit, so hat es sich auch in empirischen Studien gezeigt (vgl. Binder et al., 2020), bietet es sich an, mit absoluten Häufigkeiten statt Wahrscheinlichkeiten in den Repräsentationen zu arbeiten. Diese bieten Schülerinnen und Schülern eine bessere Zugänglichkeit zur Thematik und über Anteilsbetrachtungen können dann auch die Wahrscheinlichkeiten bestimmt werden.47 Als (fiktive) Anzahl für die Grundgesamtheit bietet sich eine hohe Zehnerpotenz an, da so auch noch kleine Anteile mit sinnvollen (ggf. gerundeten) ganzen Zahlen bestimmt werden können.

References

Binder, K., Krauss, S., & Wiesner, P. (2020). A New Visualization for Probabilistic Situations Containing Two Binary Events: The Frequency Net. Frontiers in Psychology, 11. https://doi.org/10.3389/fpsyg.2020.00750
Korn, M.-L. (2023). Kognitive Aktivierung mit digitalen Medien im Mathematikunterricht. Ein Beispiel einer digitalen Lernumgebung zum Thema Boxplots [Unveröffentlichte Masterarbeit]. Universität Potsdam.
Krüger, K., Sill, H.-D., & Sikora, C. (2015). Didaktik der Stochastik in der Sekundarstufe I. Springer Berlin Heidelberg. https://doi.org/10.1007/978-3-662-43355-3
Riemer, W. (1988). Riemer-Würfel. Klett. http://www.riemer-koeln.de/mathematik/quader/riemer-wuerfel-klett.pdf
Tietze, U.-P., Klika, M., & Wolpers, H. (Hrsg.). (2002). Mathematikunterricht in der Sekundarstufe II. Band 3: Didaktik der Stochastik. Vieweg+Teubner Verlag. https://doi.org/10.1007/978-3-322-83144-6
Wikipedia. (o. J.). Schweinerei (Spiel) — Wikipedia, die freie Enzyklopädie. https://de.wikipedia.org/w/index.php?title=Schweinerei_(Spiel)&oldid=214496187

  1. Mathematisch präzise müsste hier von relativen Häufigkeiten anstatt von Wahrscheinlichkeiten gesprochen werden.↩︎