Estimat: Forskelle mellem versioner

Fra Wikipedia, den frie encyklopædi
Content deleted Content added
Zheric (diskussion | bidrag)
m link
Zheric (diskussion | bidrag)
generel revision
Linje 1: Linje 1:
Indenfor [[statistik]] er et '''estimat''' en beregning af en størrelse ud fra et datasæt, som kan være mangelfuldt eller indeholde [[støj (statistik)|støj]]. Det kan eksempeltvist være et statistik mål (for eksempel [[middelværdi]]en) eller en parameter i en [[model (matematik)|model]]. Man opererer med en teoretisk ''sand værdi'' for størrelsen, som estimatet er en vurdering af. Generelt kan man ikke finde den sande værdi, men kun et estimat af den.
Indenfor [[statistik]] er et '''estimat''' en beregning af en ukendt størrelse ud fra en [[stikprøve]], som kan være mangelfuldt eller indeholde [[støj (statistik)|støj]]. Størrelsen kan eksempeltvist være et statistik mål (for eksempel [[middelværdi]]en) eller en parameter i en [[regressionsanalyse|regressionsmodel]]. Der findes punkt estimat, hvor størrelsen estimeres med én enkel værdi, og interval estimat, hvor det det [[interval (matematik)|interval]] størrelsen med en given sandsynlighed befinder sig indenfor udregnes.


Der opereres med en teoretisk ''sand værdi'' for størrelsen, som estimatet er en vurdering af. Den sande værdi er den værdi, der fås, hvis hele [[population]]en undersøges. Det er ofte umuligt, da der kan være uendeligt mange tilfælde. Derfor kan den sande værdi generelt ikke bestemmes, men kun et estimat af den.
Et eksempel hvor man kan finde den sande værdi er hvor mange stemmer de enkelte partier og personer får til en [[folkeafstemning]]. Før folkeafstemningen laves der undersøgelser af hvad folk vil stemme. Her får man et estimat af stemmefordelingen. Den sande værdi får man, når stemmerne er talt op. Andre ting, for eksempel antallet af venstrehåndede mennesker i verden, er det kun teoretisk muligt at tælle op. Det ville kræve, at man skulle i kontakt med alle levende mennesker indenfor et kort tidsrum, hvor ingen dør eller bliver født. Derfor undersøger man måske 10.000 mennesker af forskellig oprindelse og siger, at de er repræsentative for hele verden.

Et eksempel, hvor den sande værdi kan bestemmes, er hvor mange stemmer de enkelte partier og personer får til en [[folkeafstemning]]. Før folkeafstemningen laves der undersøgelser af hvad folk vil stemme. Ud fra en stikprøve fås et estimat af stemmefordelingen. Den sande værdi fås, når stemmerne er talt op. Andre ting, for eksempel antallet af [[Venstrehåndet|venstrehåndede]] mennesker i verden, er det kun teoretisk muligt at tælle op. Det ville kræve, at man skulle i kontakt med alle levende mennesker indenfor et kort tidsrum, hvor ingen dør eller bliver født, hvilket ikke er praktisk muligt. Derfor undersøger man i stedet måske 10.000 udvalgte mennesker af forskellig oprindelse og siger, at de er repræsentative for hele verden.


==Centralt estimat==
==Centralt estimat==
Et estimat er centralt, hvis [[forventningsværdi]]en af estimatet er lig den sande værdi. Dette betyder, at hvis man tager gennemsnittet af uendeligt mange estimater af værdien, vil dette være den sande værdi.
Et estimat er ''centralt'', hvis [[forventningsværdi]]en af estimatet er lig den sande værdi. Dette betyder, at hvis man tager gennemsnittet af uendeligt mange estimater af værdien, vil dette være den sande værdi.


Et estimat, der ikke er centralt, har en ''skævhed'' (engelsk: ''bias''), som er differencen mellem forventningsværdien og den sande værdi. Altså en systematisk fejl,estimater generelt er højere eller lavere end den sande værdi.
Et estimat, der ikke er centralt, har en ''skævhed'' (engelsk: ''bias''), som er differensen mellem forventningsværdien og den sande værdi. Altså en systematisk fejl så estimatet generelt er højere eller lavere end den sande værdi.


I nogle statistiske modeller kan man vælge om man vil have skævhed eller [[varians]] i sit estimat. Stor varians medfører, at man skal have mange værdier for at få et godt estimat, mens skævhed medfører, at man ikke kan regne værdien nøjagtigt.
I nogle statistiske modeller kan man vælge, om man vil have skævhed eller [[varians]] i sit estimat. Stor varians medfører, at man skal have mange observationer for at få et godt estimat, mens skævhed medfører, at man ikke kan regne værdien nøjagtigt. Afvejningen af om man vil have meget varians eller meget skævhed kaldes på engelsk ''bias-variance trade-off''.


==Se også==
==Se også==
[[Konfidensinterval]]
* [[Konfidensinterval]]
* [[Store tals lov]]

* [[Forsøgsplanlægning]]
[[Store tals lov]]


==Referencer==
==Referencer==

Versionen fra 14. jul. 2007, 22:31

Indenfor statistik er et estimat en beregning af en ukendt størrelse ud fra en stikprøve, som kan være mangelfuldt eller indeholde støj. Størrelsen kan eksempeltvist være et statistik mål (for eksempel middelværdien) eller en parameter i en regressionsmodel. Der findes punkt estimat, hvor størrelsen estimeres med én enkel værdi, og interval estimat, hvor det det interval størrelsen med en given sandsynlighed befinder sig indenfor udregnes.

Der opereres med en teoretisk sand værdi for størrelsen, som estimatet er en vurdering af. Den sande værdi er den værdi, der fås, hvis hele populationen undersøges. Det er ofte umuligt, da der kan være uendeligt mange tilfælde. Derfor kan den sande værdi generelt ikke bestemmes, men kun et estimat af den.

Et eksempel, hvor den sande værdi kan bestemmes, er hvor mange stemmer de enkelte partier og personer får til en folkeafstemning. Før folkeafstemningen laves der undersøgelser af hvad folk vil stemme. Ud fra en stikprøve fås et estimat af stemmefordelingen. Den sande værdi fås, når stemmerne er talt op. Andre ting, for eksempel antallet af venstrehåndede mennesker i verden, er det kun teoretisk muligt at tælle op. Det ville kræve, at man skulle i kontakt med alle levende mennesker indenfor et kort tidsrum, hvor ingen dør eller bliver født, hvilket ikke er praktisk muligt. Derfor undersøger man i stedet måske 10.000 udvalgte mennesker af forskellig oprindelse og siger, at de er repræsentative for hele verden.

Centralt estimat

Et estimat er centralt, hvis forventningsværdien af estimatet er lig den sande værdi. Dette betyder, at hvis man tager gennemsnittet af uendeligt mange estimater af værdien, vil dette være den sande værdi.

Et estimat, der ikke er centralt, har en skævhed (engelsk: bias), som er differensen mellem forventningsværdien og den sande værdi. Altså en systematisk fejl så estimatet generelt er højere eller lavere end den sande værdi.

I nogle statistiske modeller kan man vælge, om man vil have skævhed eller varians i sit estimat. Stor varians medfører, at man skal have mange observationer for at få et godt estimat, mens skævhed medfører, at man ikke kan regne værdien nøjagtigt. Afvejningen af om man vil have meget varians eller meget skævhed kaldes på engelsk bias-variance trade-off.

Se også

Referencer

Propability and Statistics for Engineers (2000) af Miller & Freund (Prentice Hall), ISBN 0-13-017974-4