Kovarians

Fra Wikipedia, den frie encyklopædi
Gå til: navigation, søg

En kovarians er et spredningsforhold mellem to forskellige stokastiske variabler X og Y og betegnes \mbox{Cov}(X,Y). Den regnes:


\mbox{Cov}(X,Y) = \mbox{E}[ (X - \mbox{E}(X)) \cdot (Y - \mbox{E}(Y)) ]


hvor \mbox{E}(X) angiver middelværdien for X. En fortolkning af formlen er, at hvis X er høj i forhold til sin middelværdi når Y er høj i forhold til sin middelværdi (og ligeledes med lav), varierer X og Y "sammen" (derfra navnet kovarians, ko = sammen).

Kovarians er ikke uafhængig overfor skalering: Hvis X bliver fordoblet, bliver kovariansen også fordoblet. Korrelation er et andet mål, som kan bruges, når man vil undgå dette problem.

Empiriske størrelser[redigér | redigér wikikode]

For en stikprøve med n datapunkter (x_1,x_2,\dots,x_n) og (y_1,\dots,y_n) beregnes empiriske kovarians således:

\mbox{Cov}(X,Y) = \frac{1}{n-1}\sum_{i=1}^n (x_i - \bar{x})\cdot (y_i - \bar{y})

hvor \bar{x} er gennemsnittet af x

Regneregler[redigér | redigér wikikode]

Rækkefølgen af X og Y er ligegyldig:

\ \mbox{Cov}(X,Y) = \mbox{Cov}(Y,X)

Kovariansen mellem en variabel og sig selv er lig variansen:

\ \mbox{Cov}(X,X) = \mbox{Var}(X)

Skaleres X og Y med konstanterne a henholdvist b, vil kovariansen skaleres med produktet af de to konstanter:

\mbox{Cov}(a\cdot X,b\cdot Y) = a\cdot b\cdot \mbox{Cov}(X,Y)

Kovarians kan også skrives

\mbox{Cov}(X, Y) = \mbox{E}(X \cdot Y) - \mbox{E}(X) \cdot \mbox{E}(Y)

Heraf følger, at hvis X og Y er uafhængige, vil kovariansen være nul, da \mbox{E}(X \cdot Y) = \mbox{E}(X) \cdot \mbox{E}(Y) for uafhængige variable.

Se også[redigér | redigér wikikode]

Matematik Stub
Denne artikel om matematik er kun påbegyndt. Hvis du ved mere om emnet, kan du hjælpe Wikipedia ved at udvide den.