Benfords lov

Fra Wikipedia, den frie encyklopædi
Gå til: navigation, søg

Benfords lov siger, at i lister over tal fra dagligdagen vil det første ciffer være 1 i ca. 30% af tallene, og højere cifre har mindre sandsynlighed for at være førsteciffer. Denne regel gælder f.eks. for regninger, husnumre, priser, indbyggertal, længde på floder og fysiske og matematiske konstanter. Den gælder dog ikke for telefonnumre, for det skal være i et bestemt interval. Loven er opkaldt efter fysikeren Frank Benford.

Forklaring[redigér | redigér wikikode]

Loven kan forklares ved, at hvis der skulle være en bestemt fordeling af det første ciffer, må reglen gælde uanset hvilke enheder vi bruger. Så hvis man har en liste over længder, som er målt i meter, skal fordelingen af førstecifre være den samme, som hvis længderne var målt i fod. For at gøre forklaringen lidt lettere sætter vi en fod til at være en tredjedel meter. Man kan nu omregne fra meter til fod ved at gange med 3. Dermed vil alle længder, som starter med 1, når de måles i meter, starte med 3, 4 eller 5, når de måles i fod. Derfor skal 1 være lige så normalt som førsteciffer, som 3, 4 og 5 er tilsammen.

Matematisk formulering[redigér | redigér wikikode]

Mere præcist siger Benfords lov at det første ciffer d (d ∈ {1, …, b - 1} ) i b-talsystemmet (b ≥ 2) optræder med sandsynlighed proportionalt med logb(d + 1) - logbd = logb((d + 1)/d). Denne sandsynlighed svarer til afstanden mellem d og d+1 på en logaritmisk skala.

I titalsystemet er der følgende fordeling mellem de første cifre, hvor d er det første cifre og p er sandsynligheden:

d p
1 30.1%
2 17.6%
3 12.5%
4 9.7%
5 7.9%
6 6.7%
7 5.8%
8 5.1%
9 4.6%


Man kan på tilsvarende vis lave en lov for de to første cifre: Sandsynligheden for at de to første cifre er n (n = 10, …, 99) er log100(n + 1) - log100(n), og tilsvarende for længere følger af cifre.

Anvendelse og begrænsninger[redigér | redigér wikikode]

I 1972 foreslog Hal Varian at reglen kunne bruges til at opdage snyd med data. Dette er baseret på formodningen om, at mennesker, der forsøger at skrive tilfældige tal, ofte vil have en jævn fordeling af førstecifre. Dermed kan Benfords lov bruges til at opdage forsikringssvindel.

Man skal dog huske på at Benfords lov ikke gælder for alle tal. Loven ikke f.eks. ikke for IQ og menneskers højde, fordi disse variabler er normalfordelte. Den gælder heller ikke på telefonnumre og tallene på nummerplader og CPR-numre, fordi disse ligger i et bestemt interval.