Digital Garden
Maths
Probability & Statistics
Continuous Random Variables

Continuous Random Variables

Eine stetige Zufallsvariable kann unendlich viele nicht Abzählbare Werte annehmen. Stetige Zufallsvariablen entstehen meist durch einen Messvorgang. Unabhängig von der Messgenauigkeit kann eine stetige Zufallsvariable innerhalb eines Intervalls unendlich viele Werte annehmen aber einen genauen Wert zu messen ist nicht wirklich möglich.

Die Wahrscheinlichkeit, dass eine stetige Zufallsvariable XX einen exakten Wert xix_i annimmt ist gleich 0. Die Begründung dafür ist, dass die Wahrscheinlichkeit das eine Person genau 180 cm gross ist, 0 ist. Grund dafür ist, dass die Person 180.000000000000001cm gross sein könnte, was nicht das Gleiche ist wie 180 cm. Deshalb macht es mehr Sin, dass XX einen Wert in einem Interval [a,b][a,b] annimmt z.B. [179.5,180.5][179.5,180.5].

Mehr zu stetigen zufallsvariablen findest du hier (opens in a new tab).

Dichtefunktion

Die Wahrscheinlichkeiten von Stetigen Zufallsvariablen werden durch die Fläche unter der Dichtefunktion f(x)f(x) für alle xx der Zufallsvariable XX beschrieben

P(aXb)=abf(x)dxP(a \leq X \leq b) = \int_{a}^{b}{f(x) dx}

stetigeDichtefunktion

Die Gesamtfläche unter der Dichtefunktion muss gleich 1 sein sonst ist sie nicht normalisiert

P(<X<)=f(x)dx=1P(-\infty < X < \infty)=\int_{-\infty}^{\infty}{f(x) dx}=1

Weil die Wahrscheinlichkeit von einem genauen Wert 0 ist haben abgeschlossene und offene Intervalle dieselben Wahrscheinlichkeiten, dies kann man dann später gut ausnutzen Fragestellungen um zu formulieren.

P(aXb)=P(a<Xb)=P(aX<b)=P(a<X<b)P(a \leq X \leq b)=P(a < X \leq b)=P(a \leq X < b)=P(a < X < b)

Erwartungswert

Genau wie bei diskreten Zufallsvariablen kann man den Erwartungswert mit einer Formel berechnen.

E(X)=xf(x)dxE(X)=\int_{-\infty}^{\infty}{x \cdot f(x) dx}

Varianz

Ebenso die Varianz

E(X)=(xE(X))2f(x)dxE(X)=\int_{-\infty}^{\infty}{(x-E(X))^2 \cdot f(x) dx}

Oder kurz geschrieben genau gleich wie bei diskreten Zufallsvariablen

E(X2)E(X)2E(X^2)-E(X)^2

Standardabweichung

Und genau gleich wie bei diskreten Zufallsvariablen die Standardabweichung

σ(X)=V(X)\sigma(X)=\sqrt{V(X)}

Verteilungsfunktion

Die Verteilungsfunktion ist definiert als

F(x)=P(Xx)=xf(y)dyF(x)=P(X \leq x)=\int_{-\infty}^{x}{f(y) dy}

Und hat die follgende Eigneschaften:

  • P(aXb)=F(b)F(a)P(a \leq X \leq b)=F(b)-F(a)
  • F(x)=f(x)F'(x)=f(x) wenn ff stetig ist.
  • limxF(x)=1\lim_{x\to\infty} F(x)=1
  • limxF(x)=0\lim_{x\to - \infty} F(x)=0

Stetige Verteilungen

Nun schauen wir uns ein paar Verteilungen an, die häufig vorkommen, wenn man mit stetigen Zufallsvariablen arbeitet.

Stetige Gleichverteilung

Die stetige Gleichverteilung wird auch oft Uniformverteilung genannt. Sie hat auf dem Intervall [a,b][a,b] eine konstante Wahrscheinlichkeitsdichte, dass heisst das alle Teilintervalle gleicher Länge dieselbe Wahrscheinlichkeit besitzen.

  • Wir schreiben dann XU[a,b]X \sim U[a,b]
  • Die Dichte von XX ist f(x)=1baf(x)=\frac{1}{b-a} wobei axba\leq x\leq b dies kommt davon, weil die Dichte normalisiert ist und die Fläche 1 ergeben muss.
  • E(X)=a+b2E(X) = \frac{a+b}{2}
  • V(X)=112(ba)2V(X) = \frac{1}{12}(b-a)^2

Stetige_Gleichverteilung_Dichte

In Matlab haben wir die Funktionen:

  • Dichte: unifpdf(x,a,b)unifpdf(x,a,b)
  • Verteilungsfunktion unifcdf(x,a,b)unifcdf(x,a,b)

Mehr dazu findest du hier (opens in a new tab) und hier (opens in a new tab).

Beispiel stetige Gleichverteilung

Eine Person kommt zu einem zufälligen Zeitpunkt zum Bahnhof. Der Zug fährt einmal pro Stunde. Wie hoch ist die Wahrscheinlichkeit, dass man höchstens 10 Minuten warten muss? Was ist die erwartete Wartezeit im Durchschnitt?

XX: Wartezeit, dann ist XU[0,60]X \sim U[0,60]

Wir erhalten also: f(x)=1ba=160f(x)=\frac{1}{b-a}=\frac{1}{60} und somit dann F(X)=160x=x60F(X)=\frac{1}{60}x=\frac{x}{60}

P(X10)=010f(x)dx=010160dx=x60010=1060060=16P(X \leq 10)=\int_{0}^{10}{f(x) dx}=\int_{0}^{10}{\frac{1}{60} dx} = \frac{x}{60} \Big|_{0}^{10}=\frac{10}{60}-\frac{0}{60}=\frac{1}{6}

Und die erwartete Wartezeit ist E(X)=a+b2=30E(X)=\frac{a+b}{2}=30 Minuten

Normalverteilung

Die Normalverteilung oder auch oft Gauss-verteilung oder Glockenkurve genannt, ist eines der wichtigsten stetigen Verteilungen. Die Normalverteilung besteht aus 2 Parametern, der Erwartungswert μ\mu und die Standardabweichung σ\sigma. Desto Kleiner σ\sigma desto enger ist die Glockenkurve.

  • Wir schreiben dann XN[μ,σ]X \sim N[\mu,\sigma]
  • Die Dichte von XX ist fμ,σ(x)=12πσ2e(xμ)22σ2f_{\mu,\sigma}(x)= \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} wobei axba\leq x\leq b
  • E(X)=μE(X) = \mu
  • V(X)=σ2V(X) = \sigma^2

normalVerteilungGraph

In Matlab haben wir die Funktionen:

  • Dichte: normpdf(x,μ,σ)normpdf(x,\mu,\sigma)
  • Verteilungsfunktion normcdf(x,μ,σ)normcdf(x,\mu,\sigma)

Mehr dazu findest du hier (opens in a new tab).

Beispiel Normalverteilung

Der Intelligenzquotient (IQ) ist normalverteilt und so festgelegt, dass μ=100\mu=100 und σ=15\sigma=15. Wie hoch ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person einen IQ zwischen 90 und 110 hat oder grösser als 150.

Es sei X der IQ der Person dann ist XN(100,15)X \sim N(100,15).

P(90X110)=P(X110)P(X90)=normcdf(110,100,15)normcdf(90,100,15)50P(90 \leq X \leq 110)=P(X \leq 110) - P(X \leq 90) = normcdf(110,100,15)-normcdf(90,100,15) \approx 50%

P(X150)=1P(X\<150)=1normcdf(150,100,15)0.04P(X \geq 150)= 1 - P(X \< 150) = 1 - normcdf(150,100,15) \approx 0.04%

Standardisierung der Normalverteilung

Mit Standardisierung bezeichnen wir die transformation einer normalverteilte Zufallsvariable XX, zu einer Zufallsvariable ZZ welches den Erwartungswert E(Z)=0E(Z)=0 und die Varianz V(Z)=1V(Z)=1 besitzt. Dies machen wir damit wir verschiedene Zufallsvariablen besser vergleichen können und damit wir auch schneller rechnen können.

Zuerst zentrieren wir die Zufallsvariable, dies machen wir, indem wir von allen ihre Elementarereignisse den Erwartungswert μ\mu abziehen. Mit Zentrieren ist hier gemeint das wir den Gipfel der funktion f(x)f(x) bei der Nullstelle der x-Achse wollen.

Danach Dividieren wir die Differenz Xμ(X)X - \mu(X) durch die Standardabweichung σ(X)\sigma (X).

Z=Xμ(X)σ(X)Z=\frac{X-\mu(X)}{\sigma(X)}

Z.B. können wir nun XN(μ,σ)X \sim N(\mu,\sigma) zu ZN(0,1)Z \sim N(0,1) umwandeln mit Z=Xμ(X)σ(X)Z = \frac{X-\mu(X)}{\sigma(X)}.

Mehr dazu findest du hier (opens in a new tab).

Quantile

Oftmals haben wir einen Wert α[0,1]\alpha \in [0,1] gegeben. Und wir suchen nun den Wert zαz_\alpha wofür P(Xzα)=αP(X \leq z_\alpha)=\alpha.

  • Wenn α=0.5\alpha = 0.5 dann reden wir vom Median, auch Zentralwert, Erwartungswert und der Modus. Eine Kennzahl dafür, wo sich die "Mitte" einer Wahrscheinlichkeitsverteilung befindet.
  • Wenn α=0.25oder0.75\alpha = 0.25 \text{oder} 0.75 reden wir von einem Quartil
  • Mit dem Perzentil schneiden wir [0,1][0,1] in 100 Teile, was equivalent ist zu den Prozentzahlen.

In Matlab haben wir die Funktionen:

  • norminv(α,μ,σ)norminv(\alpha,\mu,\sigma) wobei norminvnorminv English ist und für "normal inverse" steht

quantileGraph

mehr dazu findest du hier (opens in a new tab)

Beispiel Quantile

Der Intelligenzquotient (IQ) ist normalverteilt und so festgelegt, dass μ=100\mu=100 und σ=15\sigma=15. Eine gewisse Schulform ist für die tiefsten 5% gedacht. Ab welchem IQ sollte man an diese Schule gehen?

XN(100,16)X \sim N(100,16)

Wir suchen also zαz_\alpha mit P(Xzα)=0.05P(X \leq z_\alpha) = 0.05

Dies bekommen wir mit der Matlab funktion norminv(0.05,100,15)=75.33norminv(0.05,100,15)=75.33

Sigma-Regeln

Für XN(μ,σ)X \sim N(\mu,\sigma) gilt

  1. P(Xμσ)68.3P(|X-\mu| \leq \sigma) \approx 68.3%
  2. P(Xμ2σ)95.5P(|X-\mu| \leq 2\sigma) \approx 95.5%
  3. P(Xμ3σ)99.7P(|X-\mu| \leq 3\sigma) \approx 99.7%

Was bedeutet, dass ein Wert einer normalverteilten Zufallsvariable mit der Wahrscheinlichkeit 68% maximal um ±σ\pm \sigma vom Erwartungswert μ\mu abweicht.

sigmaRegelnGraph

mehr dazu findest du hier (opens in a new tab)

Exponentialverteilung

Die Exponentialverteilung beschreibt zufällige Lebensdauern von Geräten oder Wartezeiten auf zufällige Ereignisse.

  • Lebensdauer einer Glühbirne
  • Wartezeit auf nächstes Erdbeben

Die Exponentialverteilung und Poisson-Verteilung haben eine enge Beziehung mit einander.

AnzahlPoi(λ)ZwischenankunftszeitExp(λ)Anzahl \sim Poi(\lambda) \leftrightarrow Zwischenankunftszeit \sim Exp(\lambda)
  • Wir schreiben dann XExp(λ)X \sim Exp(\lambda)
  • Die Dichte von XX ist F(x)=λeλxF'(x)= \lambda e^{-\lambda x}
  • Die Verteilung von XX ist F(x)=1eλxF(x)= 1 - e^{-\lambda x}
  • E(X)=1λE(X) = \frac{1}{\lambda}
  • V(X)=1λ2V(X) = \frac{1}{\lambda^2}

In Matlab haben wir die Funktionen:

  • Dichte: exppdf(x,1/λ)exppdf(x,1/\lambda)
  • Verteilungsfunktion expcdf(x,1/λ)expcdf(x,1/\lambda)

Mehr dazu findest du hier (opens in a new tab).

Beispiel Exponential-Verteilung

In einem Geschäft kommen im Schnitt 20 Kunden pro Stunde.

  1. Wie hoch ist die Wahrscheinlichkeit, dass mehr als 30 Kunden in einer Stunde kommen? XPoi(20),P(X>30)=1poisscdf(30,20)X \sim Poi(20),\, P(X > 30)=1-poisscdf(30,20)
  2. Wie hoch ist die Wahrscheinlichkeit, dass man weniger als 5 Minuten auf den ersten Kunden warten muss? TExp(20),P(T112)=expcdf(1/12,1/20)T \sim Exp(20),\,P(T \leq \frac{1}{12})=expcdf(1/12,1/20)

Gedächtnislosigkeit

Die Exponential-Verteilung hat die spezielle Eigenschaft, dass sie kein Gedächtnis hat.

Was so viel heisst, wie wenn ein Gerät mit einer exponential verteilten Lebensdauer XX während tt Stunden gelaufen ist, so ist die Wahrscheinlichkeit, dass es weitere hh Stunden läuft gleich gross, wie wenn ein neues Gerät hh Stunden läuft. Dies können wir mit ein wenig Mathematik und bedingte Wahrscheinlichkeiten auch beweisen

P(Xt+hXt)=P(Xt+hXt)Xt=P(Xt+h)XtP(X \geq t + h | X \geq t) = \frac{P(X \geq t + h \cup X \geq t)}{X \geq t} = \frac{P(X \geq t + h)}{X \geq t} =P(Xh)=eλ(t+h)eλt=eλh=P(Xh)=P(X \geq h)=\frac{e^{-\lambda (t+h)}}{e^{-\lambda t}}=e^{-\lambda h}=P(X \geq h)