Standardavvik

Fra Wikipedia, den frie encyklopedi

Standardavviket er et mål for spredningen av verdiene i et datasett eller av verdien av en stokastisk variabel. Standardavviket gir verdienes gjennomsnittlige avstand fra gjennomsnittet. Den er definert som kvadratroten av variansen.

En av grunnene til at standardavviket er en viktig parameter, er Tsjebysjevs ulikhet som sier at de fleste verdiene i et datasett av tilfeldige variabler vil ligge i nærheten av gjennomsnittet, hvor «i nærheten» er definert ved hjelp av standardavviket. Standardavviket ligger på det punktet hvor kurven i normalfordelingen endrer retning.

Animasjon som viser 1, 2 og 3 standardavvik fra gjennomsnittsverdiet i et datasett.

Før man bruker standardavvik bør man bruke et histogram eller en frekvenstabell for å undersøke om datasettet er normalfordelt da mange statistiske metoder ikke kan stoles på dersom datasettet har skjevhet eller ekstremverdier[1].

Standardavviket ble introdusert av Francis Galton mot slutten av 1860-tallet.

Mørkeblå farge viser verdier som er under ett standardavvik fra gjennomsnittsverdien. I en normalfordeling vil 68,27 % av datasettet være under ett standardavvik fra gjennomsnittet. 95,45 % er under to standardavvik fra gjennomsnittet (himmelblå farge), 99,73 % under tre standardavvik og 99,994 % under fire.

Definisjon[rediger | rediger kilde]

Med en gitt en populasjon x1, ..., xN av reelle tall, er gjennomsnittet gitt ved

og standardavviket definert som

.

Standardavviket til en stokastisk variabel X er definert som

,

hvor E(X) er forventningsverdien til X.

Hvis man har stikkprøver x1,...,xn fra en større populasjon, defineres det empiriske standardavviket som

Relativt standardavvik[rediger | rediger kilde]

Ved å dividere standardavviket med gjennomsnittsverdien får en relativt standardavvik. Dette oppgis som regel i prosent.

Måleenhet[rediger | rediger kilde]

Standardavvik har som regel samme benevning som måleenheten til verdiene i datasettet. Et unntak er for verdier som har prosent som benevning. Siden en differanse mellom to prosentmålinger har enhet prosentpoeng, vil standardavviket til slike datasett ha enhet prosentpoeng. Det gjøres likevel ofte feil med dette, og prosent brukes som benevning også for standardavviket, noe som gjør det uklart om det er snakk om et vanlig standardavvik eller et relativt standardavvik.

Referanser[rediger | rediger kilde]

  1. ^ Fligner, Moore Notz (2015). The Basic Practice of Statistics. New York: W. H. Freeman and Company. s. 59.