Markov Chains
Stochastische Prozesse
Ein stochastischer Prozess beschreibt die Zustände eines Systems zu einem bestimmten Zeitpunkt welche vom Zufall beeinflusst sind.
Für jeden Zeitpunkt beschreibt die Zufallsvariable den Zustand eines Systems zum Zeitpunkt . Dann heisst oder kurz stochastischer Prozess mit Zustandsraum . Wir beschränken uns hier auf Prozesse mit diskreter Zeit und diskretem Zustandsraum, also sind beide endlich abzählbar ().
Markow-Kette
Bei vielen Systemen hängt der Folgezustand nur vom aktuellen Zustand ab, und nicht noch von allen Zuständen davor. Solche Prozesse nennt man Markow-Ketten. Mathematische ausgedrückt sieht das dann so aus für
hierbei sind alle . Ein Beispiel hier wäre, dass wenn ein Server ohne Probleme läuft, dann hat er mit 0.9 Wahrscheinlichkeit am nächsten Tag auch kein Problem. Hat er jedoch ein Problem dann hat er mit 0.5 Wahrscheinlichkeit am nächsten Tag immer noch ein Problem.
Homogene Markow-Kette, HMK
Wenn nicht nur die ganze Historie sondern auch der Tag keine Rolle spielt dann ist es eine homogene Markow-Kette (HMK). Dies wäre nicht der Fall wenn die Wahrscheinlichkeit, dass am Sonntag der Server noch Probleme hat, wenn er am Samstag schon ein Problem hat anders ist also alle andere Tage (Obwohl dies sehr wahrscheinlich der Fall ist weil niemand am Sonntag arbeitet um den Server zu reparieren). Eine Markow-Kette ist also homogen, wenn die Übergangswahrscheinlichkeiten für alle gleich sind.
Übergangs-Matrix / Graph
In diesem Fall heisst die Matrix eine Übergangsmatrix wobei (Zeile= und Spalte=). Wichtig hierbei ist, dass die Summe der Reihen 1 ergeben weil die Wahrscheinlichkeiten normalisiert sind.
Oftmals werden Markow-Ketten auch mit Hilfe von einem Übergangsgraph dargestellt.
Zustände in der Zukunft
Mit der Übergangsmatrix können wir Zustände des Systems in der Zukunft berechnen solange wir den Startwert kennen in dem wir folgendes machen
Jedoch ist der Startwert nicht immer bekannt dieser kann auch zufällig sein. Zum Beispiel kann ein Server mit 1% Wahrscheinlichkeit beim liefern schon kaputt gehen. Man hat also eine Startverteilung für alle . Einen nicht zufälligen also festen Startwert kann man auch so modellieren für all andere .
Der Vektor mit den Einträgen für alle bezeichnet man meistens mit . Mit bezeichnet man den Vektor mit den Einträgen für für alle . Daraus folgt dann
Für unseres vorherige Beispiel erhalten wir also die Startverteilung daraus können wir dann berechnen was die Verteilung am ersten Tag, am vierten etc ist.
Reguläre HMK
Die Frage, ob der Server an einem konkreten Tag Probleme hat, ist aber eigentlich gar nicht so wichtig. Viel wichtiger ist die Frage, an wie vielen Tagen der Server langfristig Probleme hat. Dazu schauen wir uns das Verhalten von über die Zeit an.
Wir sehen also das nach einer Phase beträgt die Wahrscheinlichkeit, das der Server an einem beliebigen Tag ein Problem hat, 16.667%. Mit einem anderen Startwert erhalten wir.
Die Konvergenz, unabhängig von der Startverteilung, ist kein Zufall, dies gilt für jede reguläre HMK. Eine HMK mit Übergangsmatrix heisst regulär wenn ein existiert, so dass all Einträge von grösser als 0 sind.
Grenzverteilung
Zu jeder regulären HMK existiert eine sogenannte Grenzverteilung(auch stationäre oder Gleichgewichtsverteilung) . Diese Grenzverteilung hat die folgende Eigenschaften
- Für jede Startverteilung gilt
- Die Zeilen der Matrix konvergieren gegen die Grenzverteilung
Um die Gleichgewichtsverteilung zu bestimmen muss man das folgende Gleichungssystem lösen:
- Normierung Bedingung (N):
- Gleichgewicht Bedingung (G):