Boksplot

Fra Wikipedia, den frie encyklopædi
Gå til: navigation, søg
Boksplot af data fra Michelson–Morley eksperimentet

Et boksplot eller kassediagram anvendes indenfor beskrivende statistik som en let metode til at illustrere median, kvartiler samt eventuelt maksimum og minimum i et sæt numeriske værdier.

Kassens øvre og nedre grænse viser øvre og nedre kvartil, og kassen indeholder således halvdelen af de observerede værdier. Kassen deles af en streg ved medianen; skævhed i observationerne viser sig ved, at medianen ikke er midt mellem øvre og nedre kvartil.

Kassen kan suppleres med "haler" (stiplede linjer i figuren), som illustrerer de ydre observationer i materialet. Følgende metoder kan anvendes til at fastlægge halernes længde.

  • Maksimum og minimum, eventuelt fraset ekstreme værdier ("outliers"). I figuren er frasete ekstreme værdier markeret med en lille cirkel.
  • En standardafvigelse over og under middelværdien for observationerne.
  • 8. og 92. percentil.
  • 2. og 98. percentil.

Listen er ikke udtømmende, og der er ikke praksis for at indikere, hvilken af metoderne er anvendt.

Der kan dannes flere bokse for forskellige delmængder af observationer. Dette vil synliggøre forskelle eller ligheder mellem de forskellige delmængder. Bredden af den enkelte boks kan anvendes til at synliggøre den enkelte delmængdes "tyngde", fx antallet af observationer i denne.

Boksplot anvendes bl.a. til at illustrere finansielle kursdata, hvor der fx. dannes en boks pr. handelsdag.