Standardna napaka povprečja: definicija, pomen in izračun

Standardna napaka povprečja: jasna razlaga, pomen in praktični izračuni. Naučite se oceniti zanesljivost vzorčnih povprečij in izboljšati vaše statistične odločitve.

Avtor: Leandro Alegsa

11-11-2025 18:59

Standardna napaka je standardni odklon vzorčne porazdelitve statistike. Izraz se lahko uporablja tudi za oceno (dobro domnevo) tega standardnega odklona, vzeto iz vzorca celotne skupine.

Povprečje nekega dela skupine (imenovanega vzorec) je običajen način za oceno povprečja celotne skupine. Merjenje celotne skupine je pogosto pretežko ali pa stane preveč denarja. Če pa izmerimo drug vzorec, bo njegovo povprečje nekoliko drugačno od povprečja prvega vzorca. Standardna napaka povprečja je način, kako ugotoviti, kako blizu je povprečje vzorca povprečju celotne skupine. To je način, s katerim lahko ugotovimo, koliko smo lahko prepričani o povprečju iz vzorca.

Pri resničnih meritvah prava vrednost standardnega odklona povprečja za celotno skupino običajno ni znana. Zato se izraz standardna napaka pogosto uporablja v pomenu približka dejanske vrednosti za celotno skupino. Več kot je meritev v vzorcu, bližje bo ugibanje resničnemu številu za celotno skupino.

Formula in izračun

Za povprečje vzorca (oznaka \u03bĉ ali \u03bc_z) je standardna napaka običajno:

SE = \u03c3 / \u221a n

kjer je \u03c3 standardni odklon populacije in n velikost vzorca. V praksi \u03c3 pogosto ni znan, zato uporabimo oceno iz vzorca (vzorečni standardni odklon s):

SE ≈ s / \u221a n

Primer: če je s = 10 in n = 25, je SE = 10 / 5 = 2.

Uporaba in interpretacija

Merilo negotovosti: SE pove, kako močno se lahko povprečje vzorca razlikuje od pravega povprečja populacije. Manjši SE pomeni večjo natančnost ocene.
Konfidencni intervali: Za oceno intervala zaupanja uporabimo SE. Na primer približen 95 % interval zaupanja za povprečje je: povprečje ± t_{n-1} · SE (uporabimo t-porazdelitev, če \u03c3 ni znan).
Hipotezno testiranje: Pri testih (npr. t-test) se razliko med opazovanim vzorčnim povprečjem in hipotezno vrednostjo deli z SE, da dobimo testno statistiko.
Vpliv velikosti vzorca: SE se zmanjšuje s \u221a n. To pomeni, da z večjim vzorcem hitreje povečamo natančnost kot z enakim proporcionalnim povečanjem variance.

Predpostavke in popravki

Neodvisnost in naključnost: Vzorec naj bo naključen in opazovanja med sabo neodvisna.
Končnost variance: Porazdelitev mora imeti končno varianco. Pri zelo težkih repih (brez končne variance) standardna napaka ni zanesljiva.
Centralni limitni izrek (CLT): Pri dovolj velikih vzorcih je porazdelitev vzorčnih povprečij približno normalna, kar upravičuje uporabo normalnih ali t-intervalov tudi, če je osnovna porazdelitev ne-normalna.
Popravek za končno populacijo: Če vzorčimo brez vračanja in je delež vzorca n/N pomemben (n/N > približno 0,05), uporabimo finično-populacijski popravek (FPC):

FPC = \u221a((N - n) / (N - 1))

Pravilna standardna napaka pri vzorčenju brez vračanja je torej: SE_corrected = (s / \u221a n) · FPC (ali uporabimo \u03c3, če je znan).

Hitri primer iz prakse

Recimo, da izmerimo višine 36 oseb in izračunamo vzorčno standardno odklon s = 9 cm, povprečje je 170 cm. Potem je SE = 9 / \u221a36 = 9 / 6 = 1,5 cm. Približen 95 % interval zaupanja (z uporabo t_{35} ≈ 2,03) je:

170 ± 2,03 · 1,5 ≈ 170 ± 3,05 → (166,95; 173,05) cm.

Povzetek

Standardna napaka meri, kako se statistika (pogosto povprečje) spreminja med možnimi vzorci.
Za povprečje velja SE = \u03c3 / \u221a n (ali SE ≈ s / \u221a n, kadar je \u03c3 neznan).
SE je osnova za konstruiranje intervalov zaupanja in za statistične teste; zmanjšuje se z večanjem vzorca.
Pri vzorčenju brez vračanja ali pri majhnih vzorcih je treba preveriti predpostavke in po potrebi uporabiti popravke (npr. FPC ali t-porazdelitev).

Za vrednost, ki je vzorčena z nepristransko normalno porazdeljeno napako, je zgoraj prikazan delež vzorcev, ki bi bil med 0, 1, 2 in 3 standardnimi odkloni nad in pod dejansko vrednostjo.

Kako najti standardno napako povprečja

Eden od načinov za ugotavljanje standardne napake povprečja je veliko število vzorcev. Najprej ugotovimo povprečje za vsak vzorec. Nato ugotovimo povprečje in standardni odklon teh vzorčnih povprečij. Standardni odklon vseh vzorčnih povprečij je standardna napaka povprečja. To je lahko veliko dela. Včasih je prezahtevno ali pa stane preveč denarja, da bi imeli veliko vzorcev.

Drug način za ugotavljanje standardne napake povprečja je uporaba enačbe, ki potrebuje samo en vzorec. Standardno napako povprečja običajno ocenimo s standardnim odklonom za vzorec iz celotne skupine (standardni odklon vzorca), deljenim s kvadratnim korenom velikosti vzorca.

S E x Ž = s n {\displaystyle SE_{\bar {x}} ={\frac {s}{\sqrt {n}}}} $SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}$

kjer je

s je vzorčni standardni odklon (tj. na vzorcu temelječa ocena standardnega odklona populacije) in

n je število meritev v vzorcu.

Kako velik mora biti vzorec, da bo ocena standardne napake povprečja blizu dejanski standardni napaki povprečja za celotno skupino? V vzorcu mora biti vsaj šest meritev. Potem bo standardna napaka povprečja za vzorec znotraj 5 % standardne napake povprečja, če bi bila izmerjena celotna skupina.

Popravki za nekatere primere

Če je število meritev 5 % ali več celotne skupine, je treba uporabiti drugo enačbo:

Če ima vzorec manj kot 20 meritev, je treba uporabiti posebne enačbe.

Včasih vzorec prihaja iz enega kraja, čeprav je celotna skupina razpršena. Prav tako je včasih vzorec lahko narejen v kratkem časovnem obdobju, čeprav celotna skupina zajema daljše časovno obdobje. V tem primeru števila v vzorcu niso neodvisna. Takrat se uporabijo posebne enačbe, s katerimi se to poskuša popraviti.

Uporabnost

Praktični rezultat: Z več meritvami v vzorcu lahko postanemo bolj prepričani o povprečni vrednosti. Potem bo standardna napaka povprečja manjša, ker se standardni odklon deli z večjim številom. Da pa bi bila negotovost (standardna napaka povprečja) povprečne vrednosti za polovico manjša, mora biti velikost vzorca (n) štirikrat večja. Standardni odklon se namreč deli s kvadratnim korenom velikosti vzorca. Da bi bila negotovost za desetino večja, mora biti velikost vzorca (n) stokrat večja!

Standardne napake je enostavno izračunati in se pogosto uporabljajo, ker:

Če je znana standardna napaka več posameznih količin, lahko v mnogih primerih enostavno izračunamo standardno napako neke funkcije teh količin;
Če je verjetnostna porazdelitev vrednosti znana, jo je mogoče uporabiti za izračun dobrega približka natančnega intervala zaupanja; in
Kadar verjetnostna porazdelitev ni znana, lahko za oceno intervala zaupanja uporabimo druge enačbe
Ko se velikost vzorca zelo poveča, načelo osrednjega limitnega teorema pokaže, da so števila v vzorcu zelo podobna številom v celotni skupini (imajo normalno porazdelitev).

Relativna standardna napaka

Relativna standardna napaka (RSE) je standardna napaka, deljena s povprečjem. To število je manjše od ena. Če jo pomnožimo s 100 %, dobimo odstotek povprečja. To pomaga pokazati, ali je negotovost pomembna ali ne. Na primer, upoštevajmo dve raziskavi o dohodku gospodinjstev, ki sta obe dobili vzorčno povprečje 50.000 USD. Če ima ena raziskava standardno napako 10.000 USD, druga pa 5.000 USD, sta relativni standardni napaki 20 % oziroma 10 %. Raziskava z manjšo relativno standardno napako je boljša, ker ima natančnejšo meritev (negotovost je manjša).

Ljudje, ki morajo poznati povprečne vrednosti, se pogosto odločijo, kako majhna naj bo negotovost, preden se odločijo za uporabo informacije. Nacionalni center za zdravstveno statistiko ZDA na primer ne poroča o povprečju, če relativna standardna napaka presega 30 %. NCHS prav tako zahteva vsaj 30 opazovanj, da se ocena lahko sporoči. ^[]

Primer

V Mehiškem zalivu je na primer veliko rdečih rib v vodi. Da bi ugotovili, koliko v povprečju tehta 42 cm dolg rdečeperka, ni mogoče izmeriti vseh rdečeperk, ki so dolge 42 cm. Namesto tega je mogoče izmeriti nekatere od njih. Ribe, ki jih dejansko izmerimo, imenujemo vzorec. V tabeli sta prikazani teži dveh vzorcev rdečega okuna, ki sta dolga 42 cm. Povprečna (srednja) teža prvega vzorca je 0,741 kg. Povprečna (srednja) teža drugega vzorca je 0,735 kg, kar je nekoliko drugače kot pri prvem vzorcu. Vsako od teh povprečij se nekoliko razlikuje od povprečja, ki bi ga dobili, če bi izmerili vsakega 42 cm dolgega rdečega okuna (kar tako ali tako ni mogoče).

Z negotovostjo povprečja lahko ugotovimo, kako blizu je povprečje vzorcev povprečju, ki bi ga dobili z merjenjem celotne skupine. Negotovost povprečja se oceni kot standardni odklon za vzorec, deljen s kvadratnim korenom števila vzorcev minus ena. Iz tabele je razvidno, da sta negotovosti srednjih vrednosti za oba vzorca zelo blizu druga drugi. Tudi relativna negotovost je negotovost v povprečju, deljena s povprečjem in pomnožena s 100 %. Relativna negotovost v tem primeru je 2,38 % in 2,50 % za oba vzorca.

Če poznamo negotovost povprečja, lahko ugotovimo, kako blizu je povprečje vzorca povprečju, ki bi ga dobili z merjenjem celotne skupine. Povprečje celotne skupine je med a) povprečjem vzorca plus negotovost povprečja in b) povprečjem vzorca minus negotovost povprečja. V tem primeru naj bi bila povprečna teža vseh 42 cm dolgih rdečevratk v Mehiškem zalivu 0,723-0,759 kg na podlagi prvega vzorca in 0,717-0,753 na podlagi drugega vzorca.

Primer rdečega okuna (znanega tudi kot rdeči boben, Sciaenops ocellatus), uporabljenega v primeru.

Vprašanja in odgovori

V: Kaj je standardna napaka?

O: Standardna napaka je standardni odklon vzorčne porazdelitve statistike.

V: Ali lahko izraz standardna napaka uporabimo za oceno standardnega odklona?

O: Da, izraz standardna napaka se lahko uporablja za oceno (dobro domnevo) tega standardnega odklona, vzetega iz vzorca celotne skupine.

V: Kako ocenimo povprečje za celotno skupino?

O: Povprečje nekega dela skupine (imenovanega vzorec) je običajen način za oceno povprečja za celotno skupino.

V: Zakaj je težko izmeriti celotno skupino?

O: Merjenje celotne skupine je pogosto pretežko ali predrago.

V: Kaj je standardna napaka povprečja in kaj določa?

O: Standardna napaka povprečja je način, kako blizu je povprečje vzorca povprečju celotne skupine. Z njo lahko ugotovimo, koliko smo lahko prepričani o povprečju iz vzorca.

V: Ali je prava vrednost standardnega odklona povprečja pri resničnih meritvah običajno znana?

O: Ne, prava vrednost standardnega odklona povprečja za celotno skupino pri resničnih meritvah običajno ni znana.

V: Kako število meritev v vzorcu vpliva na natančnost ocene?

O: Več kot je meritev v vzorcu, bližje bo ocena resničnemu številu za celotno skupino.

Iskati