Discrete Random Variables
Zufallsvariablen
Eine Zufallsvariable ist eine Funktion welche jedem Elementarereignis genau eine reele Zahl zuordnet. Wir unterscheiden noch dabei, ob eine Zufallsvariable diskret oder stetig ist. Hier werden wir diskrete Zufallsvariablen anschauen später werden wir noch stetige dazu nehmen.
Diskrete Zufallsvariablen
Eine diskrete Zufallsvariable kann endlich viele oder abzählbar unendliche viele Werte annehmen. Gute Beispiel dafür sind Ergebnisse beim Würfeln, Anzahl Münzwurfe bis zum ersten Mal Kopf etc.
Eine gute Videoerklärung dazu gibt es auch hier (opens in a new tab).
Dichte/Wahrscheinlichkeits-Funktion
Bei einer diskreten Zufallsvariable gehört zu jedem Wert eine bestimmte Wahrscheinlichkeit . Diese Beziehung lässt sich gut mit einer sogenannten Verteilungstabelle oder einem Stabsdiagramm (Wahrscheinlichkeitsdiagramm) visualisieren, dabei gilt
Eine Dichtefunktion ist auch normiert, das heist, dass alle Wahrscheinlichkeiten der verschiedenen Werte der Zufallsvariable zusammen 1 ergeben.
Verteilungstabelle:
Stabsdiagramm:
mehr dazu findest du hier (opens in a new tab).
Verteilungsfunktion
Die Verteilungsfunktion einer Zufallsvariable ist die Wahrscheinlichkeit dafür, dass die Zufallsvariable einen Wert, der kleiner oder gleich annimmt.
Die Wahrscheinlichkeit bei einer diskreten Zufallsvariable ist gegeben durch
mehr dazu findest du hier (opens in a new tab).
Erwartungswert
Der Erwartungswert ist der Wert, den wir im Durchschnitt erwarten können und ist definiert als
Beim Wurf eines Würfels mit Augenzahl ist
Erwartungswerte addieren
Wir werfen eine Münze, solange bis zum ersten Mal Kopf, dann würfeln wir, solange bis eine 6 kommt.
Wie hoch ist die totale erwartete Anzahl würfe?
Erwartungswert, Skalar multiplizieren
Erwartungswert, Skalar addieren
Erwartungswert, Funktion anwenden
Für all Funktionen
Ein Computerhändler hat 3 Computer für 500 CHF pro Stück gekauft, die er für 1000 CHF vor Neujahr verkaufen will.
Der händler weiss, dass er alle nicht verkauften Computer nach Neujahr garantiert für 200 CHF an ein Unternehmen verkaufen kann.
Der Händler denkt, wenn die Anzahl verkaufte Computer entspricht, dass er die folgende Verteilung hat.
Varianz
Wenn wir den Erwartungswert von als beschreiben, dann ist die Varianz gegeben durch
oder auch in kurz
Varianz, Skalar addieren
Varianz, Skalar multiplizieren
Standardabweichung
Die Standardabweichung ist gegeben durch
Diskrete Verteilungen
Nun schauen wir uns ein paar Verteilungen, an die häufig vorkommen, wenn man mit diskreten Zufallsvariablen arbeitet.
Binomial-Verteilung
Die Binomialverteilung der Zufallsvariable ist die Anzahl Treffer bei der -maligen unabhängigen Durchführung eines Experiments mit 2 Elementarereignisse, Treffer und kein Treffer wobei die Wahrscheinlichkeit für einen Treffer ist.
- Wir schreiben dann
- Die Dichtefunktion von ist wobei die Anzahl benötigter treffer ist.
In Matlab haben wir die Funktionen:
- Dichtefunktion wobei English ist und für "probability density function" steht
- Verteilungsfunktion wobei English ist und für "cumulative distribution function" steht
mehr dazu findest du hier (opens in a new tab).
Ein Multiple Choice Test besteht aus 12 Fragen mit je 4 möglichen Antworten wovon immer genau 1 richtig ist. Der Test wird durch Erraten ausgefüllt. Wie gross ist die Wahrscheinlichkeit für mehr als 8 richtige Antworten?
Mit
Und somit dann
Bernoulli-Verteilung
Die Bernoulli-Verteilung ist eine spezielle Form der Binomialverteilung wobei . Wir können dann alles ein wenig vereinfachen.
- Wir schreiben dann
- Die Dichtefunktion von ist
mehr dazu findest du hier (opens in a new tab).
Geometrische-Verteilung
Die Geometrische Verteilung der Zufallsvariable ist die Anzahl der Versuche bis zum ersten Treffer bei der wiederholten unabhängigen Durchführung eines Experiments mit 2 Elementarereignisse, Treffer und kein Treffer wobei die Wahrscheinlichkeit für einen Treffer ist.
- Wir schreiben dann
- Die Dichtefunktion von ist wobei bedeutet, dass die ersten Versuche kein Treffer waren aber der -te Versuch ein Treffer ist.
In Matlab haben wir die Funktionen:
- Dichtefunktion:
- Verteilungsfunktion
mehr dazu findest du hier (opens in a new tab).
Wir würfeln solange bis eine sechs kommt. Wie hoch ist die Wahrscheinlichkeit, dass dies im zehnten Versuch passiert?
Mit %
Hypergeometrische-Verteilung
Die Hypergeometrische Verteilung der Zufallsvariable ist die Verteilung, die beim -maligen Ziehen ohne Zurücklegen und ohne Reihenfolge aus einer Urne mit Kugeln, von denen eine spezielle Eigenschaft haben und wo die Anzahl der gezogenen Kugeln mit dieser speziellen Eigenschaft gezählt werden.
- Wir schreiben dann
- Die Dichtefunktion von ist wobei die Gesamtanzahl der Kugeln ist, die Anzahl mit der speziellen Eigenschaft. ist dann der Umfang der Stichprobe also die Anzahl der entnommenen Kugeln und die Anzahl angestrebte Kugeln mit der speziellen Eigenschaft.
In Matlab haben wir die Funktionen:
- Dichtefunktion:
- Verteilungsfunktion
mehr dazu findest du hier (opens in a new tab).
Das perfekte Beiepiel dafür ist Lotto, wobei wir 49 nummerierte Kugeln haben, 6 davon werden gezogen, welche in diesem Falle unsere spezielle Kugeln sind. Wir dürfen 6 Zahlen aufschreiben, also sind das unsere Kugeln die wir herausnehmen ohne zurücklegen oder die Reihenfolge zu beachten. Was ist nun die Wahrscheinlichkeit das wir 4 von den 6 richtig haben?
%
Poisson-Verteilung
Die Poisson-Verteilung kommt bei Zufallsvariablen zum Einsatz, welche die Anzahl der Ereignisse einer bestimmten Art in einem Zeit- und/oder Ortsintervall beschreiben die Anzahl dieses Ereignisses entspricht . Diese Ereignisse sind oftmals "seltene" Ereignisse z.B.
- Anzahl Druckfehler auf einer Seite eines Buchs
- Anzahl Unfälle an einem Wochenende in einem Skigebiet
- Anzahl falsch gewählter Telefon-Nummern an einem Tag
- Anzahl Erdbeben in einem Jahr in einer bestimmten Region.
Dies sind nur ein paar Beispiele der Poisson-Verteilung, sie ist einer der wichtigsten Verteilungen die wir kennen.
- Wir schreiben dann
- Die Dichtefunktion von ist
In Matlab haben wir die Funktionen:
- Dichtefunktion: poisspdf(k,)
- Verteilungsfunktion poisscdf(k,)
mehr dazu findest du hier (opens in a new tab)
Der Druchschnitt der Anzahl Druckfehler pro Seite ist 0.4. Dann ist ein gutes Modell. Damit erhalten wir:
- %
- %