14 Stochastik
Ziele
- Sie wissen um die Bedeutung des Modellierens bei stochastischen Situationen.
- Sie kennen verschiedene Möglichkeiten, stochastische Begriffe oder Verfahren zu visualisieren, insbesondere zu allgemeinen stochastischen Vorgängen (z. B. Zufallsexperimente), zur Kombinatorik und zu bedingten Wahrscheinlichkeiten.
Material
- Folien zum Kapitel 14 (pdf, Keynote)
- Virtuelles Arbeitsmittel zum Boxplot (html, Cinderella)
Literaturempfehlungen
14.1 Stochastische Vorgänge
14.1.1 Modellierungsstruktur
Grundsätzlich ist es Aufgabe der Stochastik, reale Prozesse zu modellieren, um diese mit mathematischen Mitteln, also einem theoretischen Modell, greifbar (und bearbeitbar) zu machen. Dazu ist es normalerweise notwendig, die reale Situation erst einmal zu vereinfachen und in ein Realmodell zu überführen (siehe Abbildung 14.1). Dieses Vorgehen ist nicht spezifisch für die Stochastik – jedoch ist der Zwischenschritt des Realmodells hier aufgrund der vielfältigen Modellierungsmöglichkeiten von besonderer Bedeutung.
Aufbauend auf diese Struktur (die »nicht als expliziter Gegenstand des Stochastikunterrichts aufzufassen« ist, Krüger et al., 2015, S. 13) können Sie Ihre Diskussionen im Unterricht leiten und Schwierigkeiten der Schülerinnen und Schüler besser einordnen, z. B.:
Wenn ein Würfel geworfen wird (reale Situation) und man die Wahrscheinlichkeit für eine Augenzahl angibt (theoretisches Modell), geht man davon aus, dass der Würfel aus sechs identischen Seiten besteht und in sich homogen ist (Realmodell). Mögliche Fragen, die auf eine solche Denkweise hinarbeiten, könnten sein: Welche Annahmen triffst du? Welche Eigenschaften muss der Würfel haben, damit du so rechnen darfst?
Wenn erstmals Zufallsgeräte (übrigens auch ein Begriff auf der Ebene der Realmodelle) genutzt werden, muss eine Untergeneralisierung vermieden werden, es sollten also frühzeitig auch nicht-Laplace-Geräte eingesetzt werden, wie Reißzwecken, Quader, sogenannte Riemer-Würfel (Riemer, 1988) oder auch Würfel-Schweine (Wikipedia, o. J.).
Wenn eine Schülerin oder ein Schüler nicht in der Lage ist, für das Ziehen einer Herz-Karte aus einem Skatblatt die Wahrscheinlichkeit anzugeben, sollten Sie als Lehrkraft herausfinden, auf welcher Ebene Schwierigkeiten bestehen. Wird die reale Situation nicht verstanden (weil z. B. die Spielkartenfarben oder der Begriff Skatblatt unbekannt sind)? Bestehen Schwierigkeiten im Aufstellen eines Realmodells (dass also das Ziehen jeder Karte mit derselben Wahrscheinlichkeit verbunden ist und dafür die Anzahl der relevanten Karten bestimmt werden muss)? Oder sind Defizite in der Theorie verortet (weil etwa nicht die Laplace-Formel für die Berechnung der Wahrscheinlichkeit angewandt werden kann oder gar Schwierigkeiten bei der Division bestehen)?
14.1.2 Prozessbetrachtung
Zur Unterstützung der Schülerinnen und Schüler in der Beschreibung stochastischer Vorgänge schlagen Krüger et al. (2015, 14 f.) die Nutzung einer Prozessbetrachtung vor (siehe Abbildung 14.2).
Es handelt sich hierbei um eine schematische Darstellung, wobei vier wesentliche Fragen relevant sind (Krüger et al., 2015, S. 15):
- »Welcher Vorgang läuft mit welchen Objekten oder Personen ab?«
- »Welches Merkmal interessiert mich? Wie kann ich das Merkmal erfassen?«
- »Welche Ergebnisse sind möglich?«
- »Welche Bedingungen beeinflussen den Vorgang?«
Das Schema und die Leitfragen können im tätigkeitstheoretischen Sinne als Orientierungshilfe aufgefasst werden. Ein solches Vorgehen ist dabei sowohl für Fragen der Wahrscheinlichkeitsrechnung als auch für die Beschreibung von Statistiken möglich, womit auch beides als Teildisziplinen der Stochastik sichtbar werden kann. Abbildung 14.3 zeigt exemplarisch zwei derartige Prozessbetrachtungen.
14.2 Kombinatorik
Eine Herausforderung kombinatorischer Fragestellungen besteht für Schülerinnen und Schüler oftmals in der korrekten Zuordnung zwischen kombinatorischer Situation und dem entsprechenden mathematischen Modell. Bei fehlendem Verständnis kann es daher in der Unterrichtsrealität schnell zum Raten kommen, welches der vier Modelle aus dem Tafelwerk gewählt wird (vgl. Tabelle 14.1).
Es soll hier nicht diskutiert werden, wie die entsprechenden Formeln begründet werden können oder in welcher Reihenfolge sich welche Einführung anbietet. Vielmehr soll überlegt werden, welche Unterstützungsmöglichkeiten Schülerinnen und Schülern geboten werden können, um verständnisfördernd Situationen den entsprechenden mathematischen Modellen zuordnen zu können. Im Prinzip sind diese Unterstützungsmöglichkeiten selbst wieder Modelle als »Brücke zwischen einer stochastischen Realsituation und dem formalen Modell« (Tietze et al., 2002, S. 197).
Zunächst gilt in allen vier Fällen: Aus einer Gesamtheit von \(n\) Objekten werden (unter bestimmten Voraussetzungen) \(k\) Objekte ausgewählt und (unter bestimmten Voraussetzungen) auf Plätze verteilt. Die Voraussetzung der Auswahl bestimmt, ob es sich um einen Vorgang mit oder ohne Wiederholung handelt. Die Voraussetzung der Verteilung ist mit oder ohne Beachtung der Reihenfolge.
Die Dichotomie »mit Beachtung der Reihenfolge« – »ohne Beachtung der Reihenfolge« kann auch über die Frage »Ist es relevant, ob ich im Nachhein meine Objekte umsortiere oder nicht?« betrachtet werden. Eine Repräsentation sollte diese Relevanz der Reihenfolge unterstützen. Abbildung 14.4 zeigt einen entsprechenden Vorschlag.
Die Dichotomie »mit Zurücklegen« – »ohne Zurücklegen« kann alternativ auch als »mit Wiederholung« – »ohne Wiederholung« aufgefasst werden. Darf nicht wiederholt werden, ergibt sich schnell, dass \(n\geq k\) gelten muss, da sonst nicht genügend Objekte vorhanden sind, aus denen gewählt wird. Die wählbaren Objekte können also als Ansammlung in einem großen Topf aufgefasst werden, aus dem sie jeweils einmalig gezogen werden können. Bei Wiederholung kann einerseits die Auffassung bestehen, dass die Objekte zurückgelegt werden dürfen (z. B. beim Ziehen bestimmter farbiger Kugeln), andererseits dass das Objekt hinreichend oft verfügbar ist (wenn z. B. Früchte für einen Obstsalat ausgewählt werden oder wenn bei einem Zahlenschloss jeweils die Ziffern 0 bis 9 zur Verfügung stehen). Abbildung 14.5 macht einen Vorschlag, wie dies allgemein repräsentiert werden kann.
Daraus ergeben sich nun die vier Optionen, dargestellt als Tabelle in Abbildung 14.6.
Diese Repräsentation kann nun unterstützen, Realsituationen zu abstrahieren und dann dem entsprechenden mathematischen Modell zuzuordnen.
14.3 Boxplot
Da beim Erstellen eines Boxplots nur mit absoluten Häufigkeiten einer geordneten Messreihe gearbeitet werden muss, bietet sich eine Behandlung auch schon in jüngeren Klassenstufen an. Hierbei treten die Begriffe Median und Spannweite sowie oberes und unteres Quartil auf.
Krüger et al. (2015, S. 123) empfehlen in der Einführung von Boxplots, zunächst auf die Behandlung von Ausreißern zu verzichten und parallel zum Boxplot die Daten als Punktdiagramm darzustellen (siehe Abbildung 14.7).
Abbildung 14.8 zeigt den Screenshot eines virtuellen Arbeitsmittels zur Erkundung von Zusammenhängen am Boxplot, das im Rahmen einer Masterarbeit an der Universität Potsdam entstanden ist (Korn, 2023).
Auch bei diesem Arbeitsmittel wird der Boxplot abhängig von der Lage der variierbaren Punkte automatisiert dargestellt. Über weitere Konfigurationen wie das Einblenden des Datensatzes oder das Ausblenden der Daten selbst können vielfältige Aufgaben bearbeitet werden (vgl. Korn, 2023):
- Verändere den Datensatz so, dass
- die Box kleiner wird,
- die linke Antenne ganz lang und die rechte Antenne ganz kurz wird,
- die rechte Hälfte der Box größer wird, aber der Median gleich bleibt.
- Erstelle einen eigenen Datensatz, blende ihn aus und lass deinen Partner bzw. deine Partnerin einen passenden Datensatz mit mindestens neun Werten finden, der denselben Boxplot produziert.
14.4 Bedingte Wahrscheinlichkeiten
Bei der Betrachtung von Situationen, in denen bedingte Wahrscheinlichkeiten eine Rolle spielen, haben Schülerinnen und Schüler (und nicht nur die) oftmals die Schwierigkeit, die verschiedenen Bedingungen auseinanderzuhalten, weshalb fehlerhafte Schlüsse gezogen werden (vgl. Binder et al., 2020).
Ist beispielsweise bekannt, dass ein Corona-Test mit 90%-iger Wahrscheinlichkeit eine Person, die an Corona erkrankt ist, auch positiv testet und mit 95%-iger Wahrscheinlichkeit eine Person, die nicht an Corona erkrankt ist, auch negativ testet, so stellt sich die Frage, wie hoch die Wahrscheinlichkeit ist, dass man tatsächlich an Corona erkrankt ist, wenn der Test positiv ausfällt. Um diese Frage zu beantworten, ist es weiterhin noch nötig zu wissen (oder zu schätzen), wie hoch der Anteil tatsöchlich erkrankter Personen in der Gesamtbevölkerung ist. Geht man von einem Anteil von 1% aus, so stellt Abbildung 14.9 eine (nicht maßstäbliche) Vierfeldertafel dieser Situationen dar.
Es sind demnach bekannt:
\[\begin{align} P(C) &= 0,\!01 \ \mathrm{(Prävalenz)}\\ P_C(T) &= 0,\!95 \ \mathrm{(Sensitivität)}\\ P_{\neg C}(\neg T) &= 0,\!99 \ \mathrm{(Spezifität)} \end{align}\]
Grundsätzlich gilt als Definition für bedingte Wahrscheinlichkeiten: \[P_B(A) = \frac{P(A\cap B)}{P(B)}\]
Nach dem Satz von Bayes und dem Satz von der totalen Wahrscheinlichkeit gilt: \[P_B(A) = \frac{P(A)\cdot P_A(B)}{P(B)} = \frac{P(A)\cdot P_A(B)}{P(A)\cdot P_A(B)+P(\neg A)\cdot P_{\neg A}(B)}\] Hieran zeigt sich schon, dass Schülerinnen und Schüler Schwierigkeiten haben könnten, wenn sie nicht die hinter den Formeln liegenden Vorstellungen entwickeln, welche Wahrscheinlichkeiten jeweils aufeinander Bezug genommen werden. Geeignete Repräsentationen sollen nun helfen, die Zusammenhänge nachvollziehen zu können. Die Vierfeldertafel aus Abbildung 14.9 ist eine solche. Abbildung 14.10 zeigt, wie die Wahrscheinlichkeiten \(P(C)\), \(P_C(T)\) und \(P_T(C)\) darin jeweils als Anteil einer Teilmengenbeziehung aufgefasst werden können.
Als Repräsentation ebenfalls verbreitet sind sogenannte Doppelbäume, siehe Abbildung 14.11. Auch dort kann nachvollzogen werden, welche Beziehung jeweils betrachtet wird.
Nach Binder et al. (2020) bietet sich ebenfalls ein Häufigkeitsnetz an, siehe Abbildung 14.12. Gegenüber den bisherigen Darstellungen können in diesem auch direkt die Schnittwahrscheinlichkeiten abgelesen werden.
Als weitere Unterstützungsmöglichkeit, so hat es sich auch in empirischen Studien gezeigt (vgl. Binder et al., 2020), bietet es sich an, mit absoluten Häufigkeiten statt Wahrscheinlichkeiten in den Repräsentationen zu arbeiten. Diese bieten Schülerinnen und Schülern eine bessere Zugänglichkeit zur Thematik und über Anteilsbetrachtungen können dann auch die Wahrscheinlichkeiten bestimmt werden.47 Als (fiktive) Anzahl für die Grundgesamtheit bietet sich eine hohe Zehnerpotenz an, da so auch noch kleine Anteile mit sinnvollen (ggf. gerundeten) ganzen Zahlen bestimmt werden können.
References
Mathematisch präzise müsste hier von relativen Häufigkeiten anstatt von Wahrscheinlichkeiten gesprochen werden.↩︎