Simpsonov paradoks

Simpsonov paradoks je paradoks iz statistike. Imenuje se po Edwardu H. Simpsonu, britanskem statistiku, ki ga je prvi opisal leta 1951. Zelo podoben učinek je leta 1899 opisal statistik Karl Pearson, leta 1903 pa ga je opisal Udny Yule. Včasih ga imenujemo Yule-Simpsonov učinek. Pri pregledu statističnih rezultatov skupin se lahko ti rezultati spremenijo, odvisno od tega, ali se skupine obravnavajo ena za drugo ali pa so združene v večjo skupino. Ta primer se pogosto pojavlja v družboslovju in medicinski statistiki. Ljudi lahko zmoti, če se za razlago vzročno-posledične povezave uporabljajo podatki o pogostosti. Druga imena za ta paradoks vključujejo paradoks preobrata in paradoks združevanja.

Primer: Zdravljenje ledvičnih kamnov

To je dejanski primer iz medicinske študije, v kateri so primerjali uspešnost dveh načinov zdravljenja ledvičnih kamnov.

V preglednici so prikazane stopnje uspešnosti in število zdravljenj pri zdravljenju majhnih in velikih ledvičnih kamnov, pri čemer zdravljenje A vključuje vse odprte postopke, zdravljenje B pa perkutano nefrolitotomijo:

Obravnava A

Obravnava B

uspeh

neuspeh

uspeh

neuspeh

Majhni kamni

Skupina 1

Skupina 2

število bolnikov

81

6

234

36

93%

7%

87%

13%

Veliki kamni

Skupina 3

Skupina 4

število bolnikov

192

71

55

25

73%

27%

69%

31%

Obe spletni strani

Skupina 1+3

Skupina 2+4

število bolnikov

273

77

289

61

78%

22%

83%

17%

Paradoksalno je, da je zdravljenje A učinkovitejše, če ga uporabimo pri majhnih kamnih in tudi pri velikih kamnih, vendar je zdravljenje B učinkovitejše, če upoštevamo obe velikosti hkrati. V tem primeru ni bilo znano, da velikost ledvičnega kamna vpliva na rezultat. To se v statistiki imenuje skrita spremenljivka (ali prikrita spremenljivka).

Katero zdravljenje velja za boljše, se določi z neenakostjo med dvema razmerjema (uspehi/skupaj). Obrat neenakosti med razmerjema, ki povzroča Simpsonov paradoks, se zgodi, ker se dva učinka pojavita skupaj:

  1. Velikosti skupin, ki so združene, če se spremenljivka "lurking" ne upošteva, so zelo različne. Zdravniki težje primere (veliki kamni) praviloma obravnavajo bolje (A), lažje primere (majhni kamni) pa slabše (B). Zato v seštevku prevladujeta skupini tri in dve, ne pa dve veliko manjši skupini ena in štiri.
  2. Spremenljivka "lurking" ima velik vpliv na razmerja, kar pomeni, da na stopnjo uspešnosti bolj vpliva resnost primera kot izbira zdravljenja. Zato je skupina bolnikov z velikimi kamni, ki uporablja zdravljenje A (tretja skupina), uspešnejša od skupine z majhnimi kamni, čeprav je slednja uporabljala slabše zdravljenje B (druga skupina).

AlegsaOnline.com - 2020 / 2023 - License CC3