Konfidensinterval

Fra Wikipedia, den frie encyklopædi

Konfidensintervaller kan bruges i statistik, når en 1-dimensionel parameter skal estimeres. Til hver stikprøve angives et interval, hvor man ud fra stikprøven antager at parameteren ligger. Hvis det for enhver værdi af den ukendte parameter gælder, at sandsynligheden for at konfidensintervallet er (mindst) p %, så siger man, at man har fundet et p % konfidensinterval for parameteren.

Fortolkning

Hvis en metode giver f.eks. 95% konfidensintervaller vil det sige at metoden med 95% sandsynlighed vil give et interval, hvori parameteren ligger. En lidt mindre præcis måde at sige det samme på er, at sige at der er 95% sandsynlighed for at parameteren ligger i intervallet. Det upræcise i den sidste formulering ligger i at de 95% sandsynlighed kun giver mening når metoden til at give konfidensintervaller angives. Man kan således forestille sig forskellige metoder som for en konkret stikprøve giver samme konfidensinterval men forskellig sandsynlighed.

Forskellige statistiske teststørrelser giver anledning til forskellige konfidensintervaller, og konfidensintervaller kan siges at være en anden måde at formulere statistiske tests på. Brug af 95% konfidensintervaller svarer således til statistiske tests på et 5% signifikansniveau.

Konfidensintervaller for normalfordelinger

Konfidensintervaller bruges særligt ved estimation af middelværdien af en normalfordelt variabel. I dette tilfælde kan konfidensintervaller udregnes som

Xmiddel ±KI

Konfidensintervallet beregnes på baggrund af

KI=t.SD/√n

hvor

Jo større stikprøven er, jo mindre bliver usikkerheden (og konfidensintervallet bliver smallere).