Konfidensinterval

Fra Wikipedia, den frie encyklopædi
Gå til: navigation, søg
Broom icon.svg Formatering
Denne artikel bør formateres (med afsnitsinddeling, interne links o.l.) som det anbefales i Wikipedias stilmanual. Husk også at tilføje kilder!
Wikitext.svg
Broom icon.svg Denne artikel behøver tilrettelse af sproget.
Sproget i denne artikel er af lav kvalitet på grund af stavefejl, grammatikfejl, uklare formuleringer eller sin uencyklopædiske stil.
Du kan hjælpe Wikipedia ved at forbedre teksten.

Konfidensintervaller kan bruges i statistik, når en 1-dimensionel parameter skal estimeres. Til hver stikprøve angives et interval, hvor man ud fra stikprøven antager at parameteren ligger. Hvis det for enhver værdi af den ukendte parameter gælder, at sandsynligheden for at konfidensintervallet er (mindst) p %, så siger man, at man har fundet et p % konfidensinterval for parameteren.

Fortolkning[redigér | redigér wikikode]

Forskellige statistiske teststørrelser giver anledning til forskellige konfidensintervaller, og konfidensintervaller er en anden måde at formulere statistiske tests på. Brug af 95% konfidensintervaller svarer til statistiske tests på et 5% signifikansniveau.

Hvis en metode giver f.eks. 95% konfidensintervaller vil det sige at metoden med (mindst) 95% sandsynlighed vil give et interval, hvori parameteren ligger. En lidt mindre præcis måde at sige det samme på er, at sige at der er 95% sandsynlighed for at parameteren ligger i intervallet. Det upræcise i den sidste formulering ligger i at de 95% sandsynlighed kun giver mening når metoden til at give konfidensintervaller angives. Man kan således forestille sig forskellige metoder som for en konkret stikprøve giver samme konfidensinterval men forskellig sandsynlighed.

z-interval for normalfordelinger[redigér | redigér wikikode]

Konfidensintervaller bruges særligt ved estimation af middelværdien af en normalfordelt variabel. Hvis standardafvigelsen er kendt kan konfidensintervaller udregnes som

Xmiddel ±KI

Konfidensintervallet beregnes på baggrund af

KI=z.SD/√n

hvor

  • z er er fraktilen af en standardnormalfordeling.
  • SD er den kendte standardafvigelse.
  • n er antallet af målinger.
  • er konfidensniveauet.

Jo større stikprøven er, jo mindre bliver usikkerheden (og konfidensintervallet bliver smallere).

t-intervaller[redigér | redigér wikikode]

Hvis man ønsker at udregne et konfidensinterval for middelværdien af en normalfordelt variabel, hvor standardafvigelsen ikke er kendt på forhånd men er estimeret ud fra en stikprøve benyttes følgende formel:

Xmiddel ±KI

Konfidensintervallet beregnes på baggrund af

KI=t.SD/√n

hvor

  • t er fraktilen af en t-fordeling med n-1 frihedsgrader.
  • SD er standardafvigelsen for målingerne.
  • n er antallet af målinger.
  • er konfidensniveauet.

t-intervaller anvendes ofte til at beregne konfidensintervaller for middelværdien af størrelser, som ikke er normalfordelte. En teoretisk begrundelse for dette kræver at antallet af målinger er så stort, at den centrale grænseværdisætning kan bruges til at lave en normalfordelingsapproksimation. Mange bruger n>30 som en tommelfingerregel for hvornår en normalfordelingsapproksimation er anvendelig.