Interval zaupanja

V statistiki je interval zaupanja posebna oblika ocene določenega parametra. Pri tej metodi je namesto ene vrednosti podan celoten interval sprejemljivih vrednosti parametra in verjetnost, da bo dejanska (neznana) vrednost parametra v tem intervalu. Interval zaupanja temelji na opazovanjih iz vzorca in se zato razlikuje od vzorca do vzorca. Verjetnost, da bo parameter v intervalu, se imenuje stopnja zaupanja. Zelo pogosto je podana v odstotkih. Interval zaupanja je vedno podan skupaj s stopnjo zaupanja. Ljudje lahko govorijo o "95-odstotnem intervalu zaupanja". Končne točke intervala zaupanja se imenujejo meje zaupanja. Za določen postopek ocenjevanja v dani situaciji velja, da višja kot je raven zaupanja, širši je interval zaupanja.

Izračun intervala zaupanja na splošno zahteva predpostavke o naravi postopka ocenjevanja - gre predvsem za parametrično metodo. Ena od pogostih predpostavk je, da je porazdelitev populacije, iz katere je vzorec, normalna. Intervali zaupanja, kot so obravnavani v nadaljevanju, zato niso robustna statistika, čeprav se lahko spremenijo, da se doda robustnost.

Pomen izraza "zaupanje"

Izraz zaupanje ima v statistiki podoben pomen kot v splošni rabi. V splošni rabi se trditev o 95-odstotnem zaupanju v nekaj običajno razume kot navedba dejanske gotovosti. V statistiki trditev o 95-odstotnem zaupanju preprosto pomeni, da je raziskovalec videl en možen interval od velikega števila možnih, od katerih devetnajst od dvajsetih intervalov vsebuje pravo vrednost parametra.

Praktični primer

A factory assembly line fills margarine cups to a desired 250g +/- 5g

Stroj napolni skodelice z margarino. Za primer je stroj nastavljen tako, da je vsebina skodelic 250 g margarine. Ker stroj ne more napolniti vsake skodelice s točno 250 g, vsebina, dodana v posamezne skodelice, nekoliko niha in se šteje za naključno spremenljivko X. Za to nihanje se predpostavlja, da je normalno porazdeljeno okoli želenega povprečja 250 g s standardnim odklonom 2,5 g. Da bi ugotovili, ali je stroj ustrezno umerjen, naključno izberemo vzorec n = 25 skodelic margarine in skodelice stehtamo. Teža margarine je X1, ..., X25, naključni vzorec iz X.

Da bi dobili vtis o pričakovanju μ, je dovolj, da podamo oceno. Ustrezna ocena je vzorčna srednja vrednost:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. } {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

Vzorec prikazuje dejanske uteži x1, ...,x25 s povprečjem:

x¯ = 1 25 ∑ i = 1 25 x i = 250,2 grama . {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250,2\,{\text{gramov}}. } {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

Če vzamemo še en vzorec 25 skodelic, lahko zlahka pričakujemo vrednosti 250,4 ali 251,1 grama. Vendar bi bila povprečna vrednost vzorca 280 gramov zelo redka, če je povprečna vsebnost skodelic dejansko blizu 250 gramov. Okoli opazovane vrednosti 250,2 vzorčne povprečne vrednosti obstaja celoten interval, znotraj katerega opazovanih podatkov ne bi obravnavali kot posebej nenavadnih, če bi celotna populacijska povprečna vrednost dejansko imela vrednost v tem razponu. Takšen interval imenujemo interval zaupanja za parameter μ. Kako izračunamo takšen interval? Končne točke intervala je treba izračunati iz vzorca, zato so statistike, funkcije vzorca X1, ..., X25 in torej same naključne spremenljivke.

V našem primeru lahko končne točke določimo tako, da upoštevamo, da je vzorčna srednja vrednost X iz normalno porazdeljenega vzorca prav tako normalno porazdeljena z enakim pričakovanjem μ, vendar s standardno napako σ/√n = 0,5 (gramov). S standardizacijo dobimo naključno spremenljivko

Z = X¯ - μ σ / n = X¯ - μ 0,5 {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0,5}}} {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

odvisna od parametra μ, ki ga je treba oceniti, vendar s standardno normalno porazdelitvijo, neodvisno od parametra μ. Zato je mogoče najti števila -z in z, neodvisna od μ, pri čemer Z leži vmes z verjetnostjo 1 - α, kar je merilo, kako prepričani želimo biti. Vzemimo 1 - α = 0,95. Torej imamo:

P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alfa =0,95.\,} {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

Število z izhaja iz kumulativne porazdelitvene funkcije:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0,975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0,975)=1,96,\end{aligned}}} {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

in dobimo:

0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X¯ - μ σ / n ≤ 1,96 ) = P ( X¯ - 1,96 σ n ≤ μ ≤ X¯ + 1.96 σ n ) = P ( X¯ - 1,96 × 0,5 ≤ μ ≤ X¯ + 1,96 × 0,5 ) = P ( X¯ - 0,98 ≤ μ ≤ X¯ + 0,98 ) . {\displaystyle {\begin{aligned}0,95&=1-\alfa =P(-z\leq Z\leq z)=P\left(-1,96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\desno)\\[6pt]&=P\levo({\bar {X}}-1,96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}}desno)\\[6pt]&=P\levo({\bar {X}}-1,96\times 0,5\leq \mu \leq {\bar {X}}+1.\\[6pt]&=P\left({\bar {X}}-0,98\leq \mu \leq {\bar {X}}+0,98\right).\end{aligned}}} {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}

To lahko razlagamo kot: z verjetnostjo 0,95 bomo našli interval zaupanja, v katerem bomo srečali parameter μ med stohastičnima končnima točkama

X - 0 . 98 {\displaystyle {\bar {X}}-0{.}98\,} {\displaystyle {\bar {X}}-0{.}98\,}

in .

X ¯ + 0.98. {\displaystyle {\bar {X}}+0,98.\,} {\displaystyle {\bar {X}}+0.98.\,}

To ne pomeni, da obstaja 0,95-odstotna verjetnost, da bo parameter μ v izračunanem intervalu. Ob vsaki ponovitvi meritev se bo pojavila druga vrednost za srednjo vrednost X vzorca. V 95 % primerov bo μ med končnimi vrednostmi, izračunanimi iz te sredine, v 5 % primerov pa ne bo. Dejanski interval zaupanja izračunamo tako, da v formulo vnesemo izmerjene uteži. Naš interval zaupanja 0,95 postane:

( x - 0,98 ; x - + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

Ker je želena vrednost 250 μ znotraj dobljenega intervala zaupanja, ni razloga za domnevo, da je naprava napačno umerjena.

Izračunani interval ima fiksne končne točke, pri čemer je μ lahko vmes (ali pa tudi ne). Tako ima ta dogodek verjetnost 0 ali 1. Ne moremo reči: "z verjetnostjo (1 - α) leži parameter μ v intervalu zaupanja. Vemo le, da bo s ponavljanjem v 100(1 - α) % primerov μ v izračunanem intervalu. V 100α % primerov pa ni. In žal ne vemo, v katerih primerih se to zgodi. Zato pravimo: "S stopnjo zaupanja 100(1 - α) % je μ v intervalu zaupanja. "

Slika na desni strani prikazuje 50 realizacij intervala zaupanja za dano populacijsko sredino μ. Če naključno izberemo eno realizacijo, je verjetnost, da bomo na koncu izbrali interval, ki vsebuje parameter, 95-odstotna; lahko pa imamo smolo in smo izbrali napačno realizacijo. Tega ne bomo nikoli izvedeli; ostali smo pri našem intervalu.

Navpični linijski odseki predstavljajo 50 realizacij intervala zaupanja za μ.Zoom
Navpični linijski odseki predstavljajo 50 realizacij intervala zaupanja za μ.

Vprašanja in odgovori

V: Kaj je interval zaupanja v statistiki?


O: Interval zaupanja je poseben interval, ki se uporablja za oceno parametra, kot je populacijska sredina, in namesto ene vrednosti podaja razpon sprejemljivih vrednosti parametra.

V: Zakaj se namesto ene vrednosti uporablja interval zaupanja?


O: Interval zaupanja se uporablja namesto ene vrednosti, da se upošteva negotovost ocene parametra na podlagi vzorca in da se poda verjetnost, da je dejanska vrednost parametra znotraj intervala.

V: Kaj je stopnja zaupanja?


O: Stopnja zaupanja je verjetnost, da je ocenjeni parameter znotraj intervala zaupanja, in je pogosto podana v odstotkih (npr. 95-odstotni interval zaupanja).

V: Kaj so meje zaupanja?


O: Meje zaupanja so končne točke intervala zaupanja, ki določajo razpon sprejemljivih vrednosti ocenjevanega parametra.

V: Kako raven zaupanja vpliva na interval zaupanja?


O: V danem postopku ocenjevanja je interval zaupanja tem širši, čim višja je raven zaupanja.

V: Katere predpostavke so potrebne za izračun intervala zaupanja?


O: Za izračun intervala zaupanja so na splošno potrebne predpostavke o naravi postopka ocenjevanja, na primer predpostavka, da je porazdelitev populacije, iz katere je vzorec, normalna.

V: Ali so intervali zaupanja zanesljiva statistika?


O: Intervali zaupanja, kot je obravnavano v nadaljevanju, niso robustna statistika, čeprav se lahko izvedejo prilagoditve za povečanje robustnosti.

AlegsaOnline.com - 2020 / 2023 - License CC3