Stokastisk variabel

For alternative betydninger, se Variabel.
Der er for få eller ingen kildehenvisninger i denne artikel, hvilket er et problem. Du kan hjælpe ved at angive troværdige kilder til de påstande, som fremføres i artiklen.

En stokastisk variabel er inden for sandsynlighedsregning og statistik en variabel, hvis værdi påvirkes af tilfældigheder. Dens mulige værdier er hver associeret med en vis sandsynlighed. Værdierne kunne f.eks. repræsentere de mulige udfald af et endnu ikke udført eksperiment. En stokastisk variabel kaldes også en tilfældighedsvariabel, jævnfør det engelske random variable.

En stokastisk variabel kan defineres som en afbildning fra et Ω-rum til et udfaldsrum . Der er altså et underliggende ω, der er skyld i observationen X(ω).

Stokastiske variable betegnes ofte med store bogstaver som X, Y og Z.

Eksempler på stokastiske variable

Et simpelt eksempel på brugen af stokastiske variable er kast med terninger. For en enkel terning kan vi definere den stokastiske variabel , som er den bijektive afbildning . Således angiver den stokastiske variabel kun udfaldet, det vil sige antallet af terningens øjne. Bruger man i stedet to terninger kan det være passende at definere en stokastisk variabel , som angiver summen af øjnene i udfaldet. Denne stokastiske variabel er ikke injektiv; Derfor er den stokastiske variabel her defineret på følgende måde:

Dette var et eksempel på en diskret stokastisk variabel, men oftest har man også brug for at definere kontinuerte stokastiske variable – fx i forbindelse med en undersøgelse, hvor man måler højden på en tilfældigt udvalgt person af en population. En typisk set kontinuert fordeling er en normalfordeling, dels fordi den optræder ofte på målinger i virkeligheden og fordi man kan normere stokastiske variable så deres gennemsnitsfordeling nærmer sig en normalfordeling. Andre eksempler på kontinuerte fordelinger er ligefordelingen, eksponentialfordelingen, paretofordelingen, gammafordelingen, weibullfordelingen, den trunkerede normalfordeling og loggammafordelingen.

Notation

Ovenfor blev stokastiske variable defineret som egentlige afbildninger. Således ville det umiddelbart være fornuftigt at se på egentlige udtryk, og fx kunne man betragte det tidligere eksempel med kast med to terninger på følgende måde:

hvor og angav øjnene på hver af terningerne. Imidlertid har man en anden, ikke så intuitiv tilgang til notationen.
Først og fremmest er man oftest ligeglad med udfaldsrummet, andre gange har man ikke kendskab til dette. Et eksempel på dette er når man skal beregne sandsynligheden for et henfald inden for et givent tidsinterval. En klump radioaktivt stof, som man fortager undersøgelser på, er kilden til et meget stort og komplekst udfaldsrum, som vi ikke er synderligt interesserede i. Således er vi ikke interesseret i de bagvedliggende udfald , hvorfor vi vil notere den stokastiske variabel med i stedet for .
Da stokastiske variable er tæt knyttet til sandsynlighedsmål, som oftest er kontinuerte, vil man for det meste se på sandsynligheden for at den stokastiske variabel antager en værdi i en given delmængde . Man betegner denne hændelse . Ved diskrete stokastiske variable skriver oftest i stedet, hvor i sagens natur, angiver en skalar eller en vektor i

Stokastiske variable og fordelinger

Når man beregner sandsynligheden for en hændelse eller har man oftest brug for fordelingsfunktioner, og sandsynlighedsfunktioner eller tæthedsfunktioner. En sandsynlighedsfunktion for en stokastisk variabel er givet ved følgende udtryk:

Hvor er et sandsynlighedsmål. Som det er sagt i det tidligere afsnit, er det en notation, der oftest bruges om fordelinger på endelige mængder, og betegner altså sandsynligheden for at den stokastiske variabel antager netop skalaren eller vektoren For det sidste terningeeksempel vil man eksempelvis kunne betragte hændelsen summen af de to øjne er 6. Man finder hurtigt, at mulige kombinationer af udfald, som giver summen 6 er 5. Således finder vi

Det vil altså sige at sandsynligheden for at terningernes sum er 6, som den stokastiske variabel X altså er et mål for, er 5/36, under antagelse af at vi altså har med en ærlig terning at gøre (at der er samme sandsynlighed for hvert udfald). Samtidigt antager vi at hvert af terningekastene er uafhængige af hinanden.