Interval zaupanja: definicija v statistiki, izračun in primeri

Interval zaupanja v statistiki: definicija, koraki za izračun, 95% primeri in razlaga predpostavk (normalnost, raven zaupanja). Naučite se pravilno tolmačiti meje.

Avtor: Leandro Alegsa

03-09-2025 00:02

V statistiki je interval zaupanja posebna oblika ocene določenega parametra. Pri tej metodi je namesto ene vrednosti podan celoten interval sprejemljivih vrednosti parametra in verjetnost, da bo dejanska (neznana) vrednost parametra v tem intervalu. Interval zaupanja temelji na opazovanjih iz vzorca in se zato razlikuje od vzorca do vzorca. Verjetnost, da bo parameter v intervalu, se imenuje stopnja zaupanja. Zelo pogosto je podana v odstotkih. Interval zaupanja je vedno podan skupaj s stopnjo zaupanja. Ljudje lahko govorijo o "95-odstotnem intervalu zaupanja". Končne točke intervala zaupanja se imenujejo meje zaupanja. Za določen postopek ocenjevanja v dani situaciji velja, da višja kot je raven zaupanja, širši je interval zaupanja.

Izračun intervala zaupanja na splošno zahteva predpostavke o naravi postopka ocenjevanja - gre predvsem za parametrično metodo. Ena od pogostih predpostavk je, da je porazdelitev populacije, iz katere je vzorec, normalna. Intervali zaupanja, kot so obravnavani v nadaljevanju, zato niso robustna statistika, čeprav se lahko spremenijo, da se doda robustnost.

Kaj pomeni interval zaupanja — pravilna interpretacija

Pomembno je razumeti, da interval zaupanja ne daje verjetnosti za posamezen izračunan interval v smislu klasične (frekventistične) statistike. Bolj pravilno je reči: če bi ponovili postopek vzorčenja in izračunali intervale zaupanja na enak način veliko krat, bi približno X% teh intervalov vsebovalo pravo (fiksno, vendar neznano) vrednost parametra, kjer je X stopnja zaupanja (npr. 95%).

Osnovne formule in primeri izračuna

Za različne parametre in situacije so formule različne. Spodaj so najpogostejši primeri.

Interval zaupanja za povprečje (σ znan):
x̄ ± z_{α/2} * (σ / √n)
kjer je x̄ vzorčno povprečje, σ standardni odklon populacije (če je znan), n velikost vzorca, z_{α/2} kvantila standardne normalne porazdelitve (npr. z_{0.025} ≈ 1.96 za 95 %).
Interval zaupanja za povprečje (σ neznan):
x̄ ± t_{n-1, α/2} * (s / √n)
kjer je s vzorčni standardni odklon, t_{n-1, α/2} kvantila Studentove t-porazdelitve z n−1 stopnjami svobode. Ta pristop se uporablja, kadar σ ni znan ali je n majhno.
Interval zaupanja za delež (binomski primer):
p̂ ± z_{α/2} * sqrt( p̂(1−p̂) / n )
kjer je p̂ delež v vzorcu. Za majhne n ali p̂ blizu 0 ali 1 so pogosto boljši Wilsonov ali exact (Clopper–Pearson) intervali.

Primer izračuna

1) Povprečje, σ znan:
Vzorec: n = 25, x̄ = 100, σ = 15. Za 95 % interval je z ≈ 1.96.
Margin of error = 1.96 * (15 / √25) = 1.96 * 3 = 5.88.
95 % CI = (100 − 5.88, 100 + 5.88) = (94.12, 105.88).

2) Delež:
Vzorec: n = 200, p̂ = 0.60. Za 95 % interval je z ≈ 1.96.
Standardna napaka = sqrt(0.6 * 0.4 / 200) ≈ 0.0346.
Margin = 1.96 * 0.0346 ≈ 0.0679.
95 % CI ≈ (0.532, 0.668).

Pogoste predpostavke in kdaj jih kršimo

Vzorec naj bo naključen in reprezentativen. Če ni, je interval lahko pristranski.
Neodvisnost opazovanj — če so opazovanja medsebojno odvisna (npr. časovne vrste), standardne formule ne veljajo brez prilagoditev.
Za metode, ki temeljijo na normalni porazdelitvi, velja približek bolje pri večjih n (centralni limitni izrek). Za majhne vzorce uporabimo t-porazdelitev ali neparametrične/Bootstrap metode.
Pri deležih je priporočljivo uporabit korekcije ali alternativne intervale, kadar je n majhen ali je p̂ blizu 0 ali 1.

Ukrepanje, ko predpostavke niso izpolnjene

Uporabite Bootstrap intervale zaupanja — delujejo pod manj strogimi predpostavkami in so preprosti za implementacijo računsko.
Za odvisne podatke uporabite ustrezne metode (npr. modeliranje časovnih vrst ali uporaba robustnih standardnih napak).
Pri binomskih podatkih z majhnim n raje uporabite Clopper–Pearson ali Wilsonov interval.

Dejavniki, ki vplivajo na širino intervala

Stopnja zaupanja: višja stopnja → širši interval (npr. 99 % > 95 %).
Velikost vzorca n: večji n → ožji interval (ker se deli s √n).
Variabilnost v populaciji (σ ali s): večja variabilnost → širši interval.

Izračun velikosti vzorca za dano natančnost

Za povprečje (σ ocenjen ali znan) in željeno absolutno napako E: n ≈ (z_{α/2} * σ / E)^2.
Za delež in željeno napako E: n ≈ p*(1−p) * (z_{α/2} / E)^2. Če p ni znan, se pogosto uporabi p = 0.5 za konservativno oceno.

Praktični nasveti

Vedno navedite stopnjo zaupanja skupaj z intervalom (npr. "95 % CI").
Izogibajte se napačnim trditvam, da "je 95 % verjetnosti, da je parameter v tem konkretnem intervalu" — to drži le v Bayesianinem okviru z ustreznimi predpostavkami.
Pri poročanju rezultatov vključite velikost vzorca, oceno variance in metodo izračuna intervala (z, t, bootstrap, Wilson ...).

Intervali zaupanja so temeljni pripomoček za ocenjevanje negotovosti v statistiki. Z razumevanjem predpostavk, pravilne interpretacije in primernih metod za dano situacijo lahko raziskovalci in odločevalci bolje presodijo zanesljivost ocenjenih parametrov.

Pomen izraza "zaupanje"

Izraz zaupanje ima v statistiki podoben pomen kot v splošni rabi. V splošni rabi se trditev o 95-odstotnem zaupanju v nekaj običajno razume kot navedba dejanske gotovosti. V statistiki trditev o 95-odstotnem zaupanju preprosto pomeni, da je raziskovalec videl en možen interval od velikega števila možnih, od katerih devetnajst od dvajsetih intervalov vsebuje pravo vrednost parametra.

Praktični primer

A factory assembly line fills margarine cups to a desired 250g +/- 5g

Stroj napolni skodelice z margarino. Za primer je stroj nastavljen tako, da je vsebina skodelic 250 g margarine. Ker stroj ne more napolniti vsake skodelice s točno 250 g, vsebina, dodana v posamezne skodelice, nekoliko niha in se šteje za naključno spremenljivko X. Za to nihanje se predpostavlja, da je normalno porazdeljeno okoli želenega povprečja 250 g s standardnim odklonom 2,5 g. Da bi ugotovili, ali je stroj ustrezno umerjen, naključno izberemo vzorec n = 25 skodelic margarine in skodelice stehtamo. Teža margarine je X1, ..., X25, naključni vzorec iz X.

Da bi dobili vtis o pričakovanju μ, je dovolj, da podamo oceno. Ustrezna ocena je vzorčna srednja vrednost:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. } ${\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.$

Vzorec prikazuje dejanske uteži x1, ...,x25 s povprečjem:

x¯ = 1 25 ∑ i = 1 25 x i = 250,2 grama . {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250,2\,{\text{gramov}}. } ${\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.$

Če vzamemo še en vzorec 25 skodelic, lahko zlahka pričakujemo vrednosti 250,4 ali 251,1 grama. Vendar bi bila povprečna vrednost vzorca 280 gramov zelo redka, če je povprečna vsebnost skodelic dejansko blizu 250 gramov. Okoli opazovane vrednosti 250,2 vzorčne povprečne vrednosti obstaja celoten interval, znotraj katerega opazovanih podatkov ne bi obravnavali kot posebej nenavadnih, če bi celotna populacijska povprečna vrednost dejansko imela vrednost v tem razponu. Takšen interval imenujemo interval zaupanja za parameter μ. Kako izračunamo takšen interval? Končne točke intervala je treba izračunati iz vzorca, zato so statistike, funkcije vzorca X1, ..., X25 in torej same naključne spremenljivke.

V našem primeru lahko končne točke določimo tako, da upoštevamo, da je vzorčna srednja vrednost X iz normalno porazdeljenega vzorca prav tako normalno porazdeljena z enakim pričakovanjem μ, vendar s standardno napako σ/√n = 0,5 (gramov). S standardizacijo dobimo naključno spremenljivko

Z = X¯ - μ σ / n = X¯ - μ 0,5 {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0,5}}} $Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}$

odvisna od parametra μ, ki ga je treba oceniti, vendar s standardno normalno porazdelitvijo, neodvisno od parametra μ. Zato je mogoče najti števila -z in z, neodvisna od μ, pri čemer Z leži vmes z verjetnostjo 1 - α, kar je merilo, kako prepričani želimo biti. Vzemimo 1 - α = 0,95. Torej imamo:

P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alfa =0,95.\,} $P(-z\leq Z\leq z)=1-\alpha =0.95.\,$

Število z izhaja iz kumulativne porazdelitvene funkcije:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0,975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0,975)=1,96,\end{aligned}}} ${\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}$

in dobimo:

0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X¯ - μ σ / n ≤ 1,96 ) = P ( X¯ - 1,96 σ n ≤ μ ≤ X¯ + 1.96 σ n ) = P ( X¯ - 1,96 × 0,5 ≤ μ ≤ X¯ + 1,96 × 0,5 ) = P ( X¯ - 0,98 ≤ μ ≤ X¯ + 0,98 ) . {\displaystyle {\begin{aligned}0,95&=1-\alfa =P(-z\leq Z\leq z)=P\left(-1,96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\desno)\\[6pt]&=P\levo({\bar {X}}-1,96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}}desno)\\[6pt]&=P\levo({\bar {X}}-1,96\times 0,5\leq \mu \leq {\bar {X}}+1.\\[6pt]&=P\left({\bar {X}}-0,98\leq \mu \leq {\bar {X}}+0,98\right).\end{aligned}}} ${\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}$

To lahko razlagamo kot: z verjetnostjo 0,95 bomo našli interval zaupanja, v katerem bomo srečali parameter μ med stohastičnima končnima točkama

X - 0 . 98 {\displaystyle {\bar {X}}-0{.}98\,} ${\bar {X}}-0{.}98\,$

in .

X ¯ + 0.98. {\displaystyle {\bar {X}}+0,98.\,} ${\bar {X}}+0.98.\,$

To ne pomeni, da obstaja 0,95-odstotna verjetnost, da bo parameter μ v izračunanem intervalu. Ob vsaki ponovitvi meritev se bo pojavila druga vrednost za srednjo vrednost X vzorca. V 95 % primerov bo μ med končnimi vrednostmi, izračunanimi iz te sredine, v 5 % primerov pa ne bo. Dejanski interval zaupanja izračunamo tako, da v formulo vnesemo izmerjene uteži. Naš interval zaupanja 0,95 postane:

( x - 0,98 ; x - + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} $({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,$

Ker je želena vrednost 250 μ znotraj dobljenega intervala zaupanja, ni razloga za domnevo, da je naprava napačno umerjena.

Izračunani interval ima fiksne končne točke, pri čemer je μ lahko vmes (ali pa tudi ne). Tako ima ta dogodek verjetnost 0 ali 1. Ne moremo reči: "z verjetnostjo (1 - α) leži parameter μ v intervalu zaupanja. Vemo le, da bo s ponavljanjem v 100(1 - α) % primerov μ v izračunanem intervalu. V 100α % primerov pa ni. In žal ne vemo, v katerih primerih se to zgodi. Zato pravimo: "S stopnjo zaupanja 100(1 - α) % je μ v intervalu zaupanja. "

Slika na desni strani prikazuje 50 realizacij intervala zaupanja za dano populacijsko sredino μ. Če naključno izberemo eno realizacijo, je verjetnost, da bomo na koncu izbrali interval, ki vsebuje parameter, 95-odstotna; lahko pa imamo smolo in smo izbrali napačno realizacijo. Tega ne bomo nikoli izvedeli; ostali smo pri našem intervalu.

Navpični linijski odseki predstavljajo 50 realizacij intervala zaupanja za μ.

Vprašanja in odgovori

V: Kaj je interval zaupanja v statistiki?

O: Interval zaupanja je poseben interval, ki se uporablja za oceno parametra, kot je populacijska sredina, in namesto ene vrednosti podaja razpon sprejemljivih vrednosti parametra.

V: Zakaj se namesto ene vrednosti uporablja interval zaupanja?

O: Interval zaupanja se uporablja namesto ene vrednosti, da se upošteva negotovost ocene parametra na podlagi vzorca in da se poda verjetnost, da je dejanska vrednost parametra znotraj intervala.

V: Kaj je stopnja zaupanja?

O: Stopnja zaupanja je verjetnost, da je ocenjeni parameter znotraj intervala zaupanja, in je pogosto podana v odstotkih (npr. 95-odstotni interval zaupanja).

V: Kaj so meje zaupanja?

O: Meje zaupanja so končne točke intervala zaupanja, ki določajo razpon sprejemljivih vrednosti ocenjevanega parametra.

V: Kako raven zaupanja vpliva na interval zaupanja?

O: V danem postopku ocenjevanja je interval zaupanja tem širši, čim višja je raven zaupanja.

V: Katere predpostavke so potrebne za izračun intervala zaupanja?

O: Za izračun intervala zaupanja so na splošno potrebne predpostavke o naravi postopka ocenjevanja, na primer predpostavka, da je porazdelitev populacije, iz katere je vzorec, normalna.

V: Ali so intervali zaupanja zanesljiva statistika?

O: Intervali zaupanja, kot je obravnavano v nadaljevanju, niso robustna statistika, čeprav se lahko izvedejo prilagoditve za povečanje robustnosti.

Iskati