Chi i anden-test

Fra Wikipedia, den frie encyklopædi
Gå til: navigation, søg
Searchtool.svg Eftersyn
Denne artikel bør gennemlæses af en person med fagkendskab for at sikre den faglige korrekthed.

Chi i anden-test (χ²-test) er en matematisk formel/metode, der bruges til at afgøre om et observeret datasæt følger den forventede fordeling. Dette gøres ved at finde sandsynligheden for at afvigelsen q ligger i den kritiske mængde. I modsætning til binomialtest kan man arbejde med et større antal hændelser end 2.

Indholdsfortegnelse

Formel for Q [redigér]

Mere præcist er sandsynligheden defineret som sandsynligheden for at den stokastiske variabel χ²- er større end vores afvigelse q. (Hvilket kan skrives P(χ²- ≥ q)) Formlen for Q (og q) er:

Q = \frac{(h_1 - x_1)^2}{x_1} +  \frac{(h_2 - x_2)^2}{x_2} + ... +\frac{(h_k - x_k)^2}{x_k} 
 =\frac{(h_1 - n \cdot p_1)^2}{n \cdot p_1} +  \frac{(h_2 - n \cdot p_2)^2}{n \cdot p_2} + ... +\frac{(h_k - n \cdot p_k)^2}{n \cdot p_k}

hvor h1, h2,...,hk er de observerede stikprøvehyppigheder for de k hændelser, x1, x2,...,xk er modelhyppighederne og p1, p2,...,pk er sandsynlighederne for de k hændelser.

χ²-fordelingen [redigér]

Sandsynlighedsfordeling for Q

χ^2-fordelingen (som ses på billedet) er ligesom normalfordelingen en absolut kontinuerttæthedsfunktion , hvor arealet under grafen er lig 1, men i modsætning til normalfordelingen, ændrer χ^2-fordelingen sig alt efter antallet af frihedsgrader (se nedenfor). Når vi i χ²-testen finder P(χ² ≥ q) finder vi altså arealet under grafen til højre for q – hvilket netop er det kritiske område.

Frihedsgrader [redigér]

Antallet frihedsgrader f er defineret som k – 1. Dette skyldes, at man i enhver fordeling har den sidste mulighed bestemt i kraft af de foregående.

Fremgangsmetode [redigér]

Når man ved hjælp af en chi i anden test vil teste om de teoretiske sandsynligheder for de k hændelser ved eksperimentet E kan accepteres, starter man med at udføre E n antal gange. På grundlag heraf udregnes q vha. den ovenstående formel og man kan således bestemme P(Q≥q) = P(χ²≥q) med visse lommeregnere. (Blandt andre TI-89)

Hvis den fundne sandsynlighed er lille, kan man konkludere at de teoretiske sandsynligheder ikke er rigtige. Ofte vælger man, at grænsen går ved 1 %, 5 % eller 10 %. Det valgte procenttal kaldes signifikansniveauet.