Zakon velikih števil (LLN) je izrek iz statistike. Upoštevajmo nek proces, v katerem se pojavljajo naključni izidi. Na primer, naključna spremenljivka se večkrat opazuje. Potem bo povprečje opazovanih vrednosti dolgoročno stabilno. To pomeni, da se bo na dolgi rok povprečje opazovanih vrednosti vedno bolj približevalo pričakovani vrednosti. Zakon velikih števil nam tako zagotavlja, da povprečje velikih vzorcev odraža pričakovano vrednost posameznega opazovanja (pod ustreznimi predpostavkami).
Osnovna ideja v kratkem
Če imamo zaporedje naključnih spremenljivk X1, X2, ..., Xn, ki so neodvisne in enako porazdeljene (i.i.d.) z obstoječo pričakovano vrednostjo μ = E[Xk], potem je vzorčno povprečje
(X1 + X2 + ... + Xn) / n
takšno, da se, ko n narašča, približuje μ. Obstajata dve pogosto omenjeni različici izreka:
- šibki zakon velikih števil (LLN v verjetnosti): vzorčno povprečje konvergira k μ v verjetnosti, kar pomeni, da je verjetnost, da je vzorčno povprečje daleč od μ, za velike n majhna;
- močan zakon velikih števil (SLLN): vzorčno povprečje konvergira k μ skoraj gotovo (skoraj vedno) — to je močnejša trditev o konvergenci.
Pogoji in omejitve
- Neodvisnost in identična porazdelitev sta pogosta predpostavka, a obstajajo splošnejše različice, ki dopuščajo šibko odvisnost ali neenake porazdelitve ob nadzorovanih pogojih.
- Konecna pričakovana vrednost: nujno je, da je E[Xk] končna. Če ima porazdelitev neskončno pričakovanje (npr. zelo težke repne porazdelitve), LLN v običajni obliki morda ne velja.
- LLN ne pove nič o hitrosti konvergence. Za hitrost približevanja μ uporabljamo druge rezultate, npr. centralni limitni izrek (ki pod določenimi pogoji pravi, da je odstopanje vzorčnega povprečja od μ približno normalno z velikostjo ~1/√n).
Primer: met kocke
Pri metanju kocke so možni izidi številk 1, 2, 3, 4, 5 in 6. Vsi so enako verjetni. Populacijska srednja vrednost (ali "pričakovana vrednost") izidov je:
(1 + 2 + 3 + 4 + 5 + 6) / 6 = 3.5.
Če kocko mečemo večkrat in za vsako število n izračunamo povprečje izidov, bo to povprečje za majhna n pogosto oddaljeno od 3,5, a z naraščanjem števila metov se bo — kot napoveduje LLN — povprečje immer bolj ustalilo okoli 3,5. Naslednji graf prikazuje rezultate poskusa metanja kocke; vidno je, da se sprva povprečje spreminja, nato pa se približa pričakovani vrednosti:

Kaj LLN ne pravi (pomembne opombe)
- LLN ne zagotavlja, da bo vzorčno povprečje že pri zmerno velikih n zelo blizu μ — v praksi je potreben ustrezen velik n, odvisen od variance in želeni natančnosti.
- NN ne popravlja pristranskosti v podatkih: če so opazovanja sistematično pristranska (npr. meritve pri napačnem postopku), povprečje bo konvergiralo k pristranskemu limitu.
- Odvisnost med opazovanji lahko LLN onemogoči; za neodvisna ali šibko odvisna zaporedja obstajajo prilagojeni izreki, prav tako za neenakomerne porazdelitve ob dodatnih pogojih.
Praktični pomen in uporaba
Zakon velikih števil ima veliko praktičnih uporab:
- v Monte Carlo simulacijah — povprečje mnogih naključnih realizacij približuje pričakovano vrednost kompleksnih sistemov;
- v anketah in vzorčenju — zakon pojasni, zakaj večje velikosti vzorcev vodijo do stabilnejših ocen populacijskih parametrov;
- v zavarovalništvu in upravljanju tveganj — razumevanje, da porazdelitev skupnih izgub pri velikem številu tveganj postaja predvidljiva;
- v kontroli kakovosti in industrijskih meritvah — povprečja ponavljanih meritev so zanesljivejša od posameznih meritev.
Sklep
Zakon velikih števil je temeljna lastnost naključnih procesov: ponuja razlog, zakaj povprečja velikih vzorcev lahko zaupamo kot ocenam pričakovanih vrednosti. Kljub temu ga je treba uporabljati premišljeno — upoštevati pogoje uporabe (neodvisnost, končna pričakovanja), razlikovati med močmi trditev (šibka vs. močna konvergenca) in upoštevati, da LLN ne pove hitrosti konvergence, ki je v praksi zelo pomembna.