Benfords lov

Fra Wikipedia, den frie encyklopædi
Spring til navigation Spring til søgning
Fordelingen af udfaldet af det første ciffer (i titalssystemet) ifølge Benfords lov. Hver søjle repræsenterer et ciffer og højden af søjlen er den procentvise sandsynlighed for, at tallet begynder med pågældende ciffer.

Benfords lov siger, at i lister over tal fra dagligdagen vil det første ciffer være 1 i ca. 30% af tallene, og højere cifre har mindre sandsynlighed for at være førsteciffer. Denne regel gælder f.eks. for regninger, husnumre, priser, indbyggertal, længde på floder og fysiske og matematiske konstanter. Loven er opkaldt efter fysikeren Frank Benford.

Matematisk formulering[redigér | redigér wikikode]

Mere præcist siger Benfords lov at det første ciffer d (d ∈ {1, …, b - 1} ) i b-talsystemmet (b ≥ 2) optræder med sandsynlighed proportionalt med logb(d + 1) - logbd = logb((d + 1)/d). Denne sandsynlighed svarer til afstanden mellem d og d+1 på en logaritmisk skala.

I titalsystemet er der følgende fordeling mellem de første cifre, hvor d er det første ciffer, og p er sandsynligheden:

d p
1 30.1%
2 17.6%
3 12.5%
4 9.7%
5 7.9%
6 6.7%
7 5.8%
8 5.1%
9 4.6%


Man kan på tilsvarende vis lave en lov for de to første cifre: Sandsynligheden for at de to første cifre er n (n = 10, …, 99) er log100(n + 1) - log100(n), og tilsvarende for længere følger af cifre.

Anvendelse og begrænsninger[redigér | redigér wikikode]

I 1972 foreslog Hal Varian at reglen kunne bruges til at opdage snyd med data. Dette er baseret på formodningen om, at mennesker, der forsøger at skrive tilfældige tal, ofte vil have en jævn fordeling af førstecifre. Dermed kan Benfords lov bruges til at opdage forsikringssvindel.

Man skal dog huske på, at Benfords lov ikke gælder for alle tal. Loven gælder f.eks. ikke for IQ og menneskers højde, fordi disse variabler er normalfordelte. Den gælder heller ikke for talstrenge som telefonnumre og tallene på nummerplader og CPR-numre, der ligger i et bestemt interval og er styret af bestemte regler.