Binomialfordelingen

Fra Wikipedia, den frie encyklopædi
Gå til: navigation, søg

Binomialfordelingen er en diskret fordeling inden for sandsynlighedsregning og beskriver en af de mest fundamentale og samtidig meget grundlæggende fordelinger. Meget kort fortalt beskriver den sandsynligheden for at få k succeser i n forsøg.

Karakteristika[redigér | redigér wikikode]

Denne fordeling beskriver en række Bernoulli-forsøg, som er det simplest tænkelige forsøg inden for sandsynlighedsregningen. Nemlig et forsøg som kan være enten succes eller fiasko, plat eller krone, god eller dårlig. Kort sagt er der altså kun to mulige udfald på denne type forsøg, hvor man altså beskriver den ene af disse ved succes, og den anden ved fiasko.

Der er tre forskellige forudsætninger, før der kan være tale om en binomialfordeling, hvis blot et af disse fejler, er der altså ikke tale om en sådan fordeling:

  • n uafhængige forsøg, hvor n er et fast antal forsøg
  • Alle n forsøg er Bernoulli-forsøg, altså succes/fiasko
  • Fast sandsynlighed p for succes, samt sandsynligheden 1-p for fiasko

Når disse betingelser er opfyldt, står man således med tre parametre, som alle indgår i tæthedsfunktion for binomialfordelingen. Man har altså n, som beskriver det samlede antal forsøg, man udfører. p, som er sandsynligheden for succes, samt x, som er tallet for antallet af succeser, man undersøger for. Disse tre tal fylder man ind i denne tæthedsfunktion, hvor X betegner en stokastisk variabel:

f(x) = P(X = x) = b(x;n,p) = {n \choose x} \cdot p^x \cdot (1-p)^{n-x}

Fordelingsfunktionen, eller den kumulative tæthedsfunktion, har følgende form:

F(x) = P(X\leq x) =B(x;n,p) = \sum_{k=0}^{x}b(k;n,p)

Man kan udlede denne formel ret intuitivt, når blot man ved nogle få ting angående sandsynlighedsregning. Et eksempel på brugen af formlen vil give et godt billede af brugen af formlen.

Eksempel[redigér | redigér wikikode]

Vi slår med en fair sekssidet terning 10 gange, men inden terningen bliver slået ønsker vi at bestemme sandsynligheden for at få 4 kast, som viser 5 eller 6 øjne.

Ud af denne tekst ved vi nu, at vi har n=10 uafhængige forsøg, hvor vi ønsker at bestemme sandsynligheden for, at x=4 af kastene opfylder succeskriteriet. Vi mangler blot p for at kunne bestemme denne sandsynlighed, men vi ved, at 5 og 6 udgør 2 ud af terningens 6 sider, hvormed p bliver lig 1/3.

For at gennemgå tankegangen bag formlen siger vi nu, at vi skal have 4 kast, som sker med sandsynligheden 1/3, og 6 kast, som vil ske med sandsynligheden 1-1/3=2/3. I og med at forsøgene er uafhængige ganger vi de enkelte sandsynligheder:

 { 1 \over 3 } \cdot { 1 \over 3 } \cdot { 1 \over 3 } \cdot { 1 \over 3 } \cdot { 2 \over 3 } \cdot { 2 \over 3 } \cdot { 2 \over 3 } \cdot { 2 \over 3 } \cdot { 2 \over 3 } \cdot { 2 \over 3 } = \left( { 1 \over 3 } \right)^4 \cdot  \left( { 2 \over 3 } \right)^6

Dette udgør imidlertid sandsynligheden for, at de fire succeser sker i de første fire kast. Vi bliver altså nødt til at finde frem til, hvor mange forskellige måder disse fire kast kan forekomme på i de 10 forsøg. Dette gør man ved hjælp af binomialkoefficienten, som er en kombinatorisk måde at udregne, hvor mange måder x kan fordele sig på i n forsøg. Udråbstegnet betyder n fakultet:

 { n \choose x } = { n! \over x!(n-x)! }

Dette tal ganger vi så på, hvormed vi får den endelige sandsynlighed:

 P(X=4) = b(4;10,1/3) = { 10 \choose 4 } \cdot \left( { 1 \over 3 } \right)^4 \cdot  \left( { 2 \over 3 } \right)^6 \approx 22.7 \%

Nøgletal[redigér | redigér wikikode]

Der findes naturligvis de sædvanlige nøgletal til binomialfordelingen, som der findes til alle andre statistiske fordelinger.

Middelværdi[redigér | redigér wikikode]

Middelværdien for binomialfordelingen er en af de mest intuitivt forståelige blandt de statistiske fordelinger. Det er ret simpelt at indse at med en sandsynlighed p for succes og et antal gentagelser n, må middelantallet af succeser, hvis man gentager forsøget mange gange, være følgende:

Middelværdi  E(X) = \mu = n \cdot p

Varians[redigér | redigér wikikode]

Variansen for binomialfordelingen tager de samme parametre som middelværdien, og er næsten lige så simpel, om end noget sværere at give en forståelig forklaring på, hvorfor den ser ud som den gør. Variansen er som følger:

\textrm{Var}(X) = \sigma^2 = n \cdot p \cdot (1-p)

Standardafvigelse[redigér | redigér wikikode]

Og standardafvigelsen er som i alle andre fordelinger blot defineret ved kvadratroden af variansen:

 \textrm{SD}(X) = \sigma = \sqrt{Var(X)} = \sqrt{n \cdot p \cdot (1-p)}