Stokastisk variabel

Fra Wikipedia, den frie encyklopædi
Gå til: navigation, søg
Merge-arrow.svg Sammenskrivningsforslag
Denne artikel er foreslået skrevet ind i artiklen Sandsynlighedsregning.   (Diskutér forslaget).
Hvis sammenskrivningen sker, skal det fremgå af beskrivelsesfeltet, at sammenskrivningen er sket (hvorfra og hvortil) eller af artiklens diskussionsside

En stokastisk variabel er en type af variabel der beskriver et tilfældigt forsøg, hvor udfaldet ikke er kendt. Et synonym for en stokastisk variabel vil altså være en tilfældighedsvariabel, jf. det engelske random variable. Stokastiske variable benyttes oftest i forbindelse med sandsynlighedsregning og statistik.

En stokastisk variabel kan defineres som en afbildning X fra et Ω-rum til et udfaldsrum E. Der er altså et underliggende ω, der er skyld i vores observation X(ω).

Stokastiske variable betegnes ofte med store bogstaver som X, Y og Z.

Eksempler på stokastiske variable[redigér | redigér wikikode]

Et simpelt eksempel på brugen af stokastiske variable, er kast med terninger. For en enkel terning kan vi definere den stokastiske variabel X, som er den bijektive afbildning X : E \to \{1,2,3,4,5,6\}. Således angiver den stokastiske variabel kun udfaldet, eller antallet af terningens øjne. Bruger man i stedet to terninger kan det være passende at definere en stokastisk variabel X, som angiver summen af øjnene i udfaldet. Denne stokastiske variabel er ikke injektiv; Vi ser, at vores stokastiske variabel er defineret på følgende måde:

X : \{1,2,3,4,5,6\} \times \{1,2,3,4,5,6\} \to \{2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12\}

Hidtil har vi kun set eksempler på diskrete stokastiske variable, men oftest har man også brug for at definere kontinuerte stokastiske variable – fx i forbindelse med en undersøgelse, hvor man måler højden på en tilfældigt udvalgt person af en population. En typisk set kontinuert fordeling er en normalfordeling, dels fordi den optræder ofte på målinger i virkeligheden og fordi man kan normere stokastiske variable så deres gennemsnits fordeling nærmer sig en normaldeling. Andre eksempler på kontinuerte fordelinger er ligefordelingen, eksponentialfordelingen, paretofordelingen, gammafordelingen, weibullfordelingen, den trunkerede normalfordeling og loggammafordelingen.

Notation[redigér | redigér wikikode]

Vi har tidligere defineret vores stokastiske variable som egentlige afbildninger. Således ville det umiddelbart være fornuftigt at se på egentlige udtryk, og fx kunne man betragte det tidligere eksempel med kast med to terninger på følgende måde:

X(T_1, T_2) = T_1 + T_2

hvor T_1 og T_2 angav øjnene på hver af terningerne. Imidlertidig har man en anden, ikke så intuitiv tilgang til notationen.
Først og fremmest er man oftest ligeglad med udfaldsrummet, andre gange har man ikke kendskab til dette. Et eksempel på dette er når man skal beregne sandsynligheden for et henfald inden for et givent tidsinterval. En klump radioaktivt stof, som man fortager undersøgelser på, er kilden til et meget stort og komplekst udfaldsrum, som vi ikke er synderligt interesserede. Således er vi ikke interesseret i de bagvedliggende udfald e, hvorfor vi vil notere den stokastiske variabel med X i stedet for X(e).
Da stokastiske variable er tæt knyttet til sandsynlighedsmål, som oftest er kontinuerte, vil man for det meste se på sandsynligheden for at den stokastiske variabel antager en værdi i en given delmængde A \subseteq R. Man betegner denne hændelse P(X \in A). Ved diskrete stokastiske variable skriver oftest P(X = a) i stedet, hvor a i sagens natur, angiver en skalar eller en vektor i \mathbb R^n

Stokastiske variabler og fordelinger[redigér | redigér wikikode]

Når man beregner sandsynligheden for en hændelse P(X = a) eller P(X \in A) har man oftest brug for fordelingsfunktioner, og sandsynlighedsfunktioner eller tæthedsfunktioner. En sandsynlighedsfunktion for en stokastisk variabel er givet ved følgende udtryk:

f(x) = P(X=x)

Hvor P er et sandsynlighedsmål. Som det er sagt i det tidligere afsnit, er det en notation, der oftest bruges om fordelinger på endelige mængder, og f(x) betegner altså sandsynligheden for at den stokastiske variabel antager netop skalaren eller vektoren x. For det sidste terningeeksempel vil man eksempelvis kunne betragte hændelsen \{X = 6\} = summen af de to øjne er 6. Man finder hurtigt, at mulige kombinationer af udfald, som giver summen 6 er 5. Således finder vi

P(X=6) = \frac{5}{36}

Det vil altså sige at sandsynligheden for at terningernes sum er 6, som den stokastiske variabel X altså er et mål for, er 5/36, under antagelse af at vi altså har med en ærlig terning at gøre. Samtidigt antager vi at hvert af terningekastene er uafhængige af hinanden.