Spearmanov koeficient korelacije

V matematiki in statistiki je Spearmanov koeficient korelacije merilo korelacije, poimenovano po njegovem avtorju Charlesu Spearmanu. Na kratko se zapiše kot grška črka rho ( ρ {\displaystyle \rho }{\displaystyle \rho } ) ali včasih kot r s {\displaystyle r_{s}}. {\displaystyle r_{s}}. To je število, ki kaže, kako tesno sta povezana dva niza podatkov. Uporablja se lahko samo za podatke, ki jih je mogoče razvrstiti po vrstnem redu, na primer od najvišjega do najnižjega.

Splošna formula za r s {\displaystyle r_{s}}{\displaystyle r_{s}} je ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}.

Če imate na primer podatke o tem, kako dragi so različni računalniki, in podatke o tem, kako hitri so računalniki, lahko s pomočjo r s {\displaystyle r_{s}} ugotovite, ali so računalniki povezani in kako tesno so povezani. {\displaystyle r_{s}}.

Delo se je začelo

Prvi korak

Za določitev r s {\displaystyle r_{s}}{\displaystyle r_{s}} morate najprej razvrstiti vsak podatek. Uporabili bomo primer iz uvoda o računalnikih in njihovi hitrosti.

Računalnik z najnižjo ceno je torej uvrščen na prvo mesto. Tisti, ki je višji od njega, bi bil na 2. mestu. Nato se vrstijo, dokler se ne razvrstijo vsi računalniki. To morate storiti za oba niza podatkov.

RAČUNALNIK

Cena ($)

R a n k 1 {\displaystyle Rank_{1}} {\displaystyle Rank_{1}}

Hitrost (GHz)

R a n k 2 {\displaystyle Rank_{2}} {\displaystyle Rank_{2}}

A

200

1

1.80

2

B

275

2

1.60

1

C

300

3

2.20

4

D

350

4

2.10

3

E

600

5

4.00

5

Drugi korak

Nato moramo poiskati razliko med obema vrstama. Razliko nato pomnožimo s samim seboj, kar imenujemo kvadratura. Razliko imenujemo d {\displaystyle d}{\displaystyle d} , število, ki ga dobimo, ko d {\displaystyle d}{\displaystyle d} kvadriramo, pa imenujemo d 2 {\displaystyle d^{2}}. {\displaystyle d^{2}}.

R a n k 1 {\displaystyle Rank_{1}} {\displaystyle Rank_{1}}

R a n k 2 {\displaystyle Rank_{2}} {\displaystyle Rank_{2}}

d {\displaystyle d} {\displaystyle d}

d 2 {\displaystyle d^{2}} {\displaystyle d^{2}}

1

2

-1

1

2

1

1

1

3

4

-1

1

4

3

1

1

5

5

0

0

Tretji korak

Preštejte, koliko podatkov imamo. Ti podatki imajo stopnje od 1 do 5, torej imamo 5 podatkov. To število se imenuje n {\displaystyle n}n .

Četrti korak

Na koncu uporabite vse, kar smo do zdaj ugotovili, v tej formuli: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}.

∑ d 2 {\displaystyle \sum d^{2}}{\displaystyle \sum d^{2}} pomeni, da vzamemo vsoto vseh številk, ki so bile v stolpcu d 2 {\displaystyle d^{2}} {\displaystyle d^{2}}. To pa zato, ker ∑ {\displaystyle \sum } {\displaystyle \sum }pomeni skupaj.

Torej je ∑ d 2 {\displaystyle \sum d^{2}}{\displaystyle \sum d^{2}} 1 + 1 + 1 + 1 + 1 {\displaystyle 1+1+1+1}{\displaystyle 1+1+1+1}, kar je 4. Formula pravi, da ga pomnožimo s 6, kar je 24.

n ( n 2 - 1 ) {\displaystyle n(n^{2}-1)} {\displaystyle n(n^{2}-1)}je 5 × ( 25 - 1 ) {\displaystyle 5\krat (25-1)}, {\displaystyle 5\times (25-1)}kar je 120.

Da bi ugotovili r s {\displaystyle r_{s}} {\displaystyle r_{s}}preprosto naredimo 1 - 24 120 = 0,8 {\displaystyle 1-{\cfrac {24}{120}}=0,8}{\displaystyle 1-{\cfrac {24}{120}}=0.8} .

Zato je Spearmanov koeficient korelacije za ta niz podatkov 0,8.

Kaj pomenijo številke

r s {\displaystyle r_{s}}{\displaystyle r_{s}} vedno daje odgovor med -1 in 1. Številke med njima so kot lestvica, kjer je -1 zelo močna povezava, 0 je brez povezave, 1 pa je prav tako zelo močna povezava. Razlika med 1 in -1 je v tem, da je 1 pozitivna povezava, -1 pa je negativna povezava. Graf podatkov z vrednostjo r s {\displaystyle r_{s}}{\displaystyle r_{s}} -1 bi bil podoben prikazanemu grafu, le da bi črta in točke potekale od leve zgoraj proti desni spodaj.

Na primer, za podatke, ki smo jih obdelali zgoraj, je r s {\displaystyle r_{s}}{\displaystyle r_{s}} znašal 0,8. To pomeni, da obstaja pozitivna korelacija. Ker je blizu vrednosti 1, to pomeni, da je povezava med obema nizoma podatkov močna. Torej lahko rečemo, da sta ta dva niza podatkov povezana in se skupaj dvigujeta. Če bi bila -0,8, bi lahko rekli, da sta povezana in da ko se eden povečuje, se drugi zmanjšuje.

Zoom

Ta razpršeni graf ima pozitivno korelacijo. Vrednost r s {\displaystyle r_{s}}{\displaystyle r_{s}} bi bila blizu 1 ali 0,9. Rdeča črta je črta najboljšega ujemanja.

Če sta dve števili enaki

Pri razvrščanju podatkov se včasih zgodi, da sta dve ali več številk enakih. Kadar se to zgodi v r s {\displaystyle r_{s}} {\displaystyle r_{s}}, vzamemo povprečje ali sredino rangov, ki so enaki. To so tako imenovani vezani rangi. To storimo tako, da vezana števila razvrstimo, kot da ne bi bila vezana. Nato seštejemo vse rangove, ki bi jih imeli, in jih delimo s številom, kolikor jih je. Recimo, da razvrščamo, kako dobro so se različni ljudje odrezali na testu pravopisa.

Rezultat testa

Rang

Položaj (z vezanimi)

4

1

1

6

2

2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3} {\displaystyle {\tfrac {2+3+4}{3}}=3}

6

3

2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3} {\displaystyle {\tfrac {2+3+4}{3}}=3}

6

4

2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3} {\displaystyle {\tfrac {2+3+4}{3}}=3}

8

5

5 + 6 2 = 5,5 {\displaystyle {\tfrac {5+6}{2}}=5,5} {\displaystyle {\tfrac {5+6}{2}}=5.5}

8

6

5 + 6 2 = 5,5 {\displaystyle {\tfrac {5+6}{2}}=5,5} {\displaystyle {\tfrac {5+6}{2}}=5.5}

Te številke se uporabljajo na enak način kot običajne stopnje.

Sorodne strani

Vprašanja in odgovori

V: Kaj je Spearmanov koeficient korelacije?


O: Spearmanov koeficient korelacije ranga je mera korelacije, ki kaže, kako tesno sta povezana dva niza podatkov. Uporablja se lahko samo za podatke, ki jih je mogoče razvrstiti po vrstnem redu, na primer od najvišjega do najnižjega.

V: Kdo je ustvaril Spearmanov korelacijski koeficient ranga?


O: Charles Spearman je ustvaril Spearmanov korelacijski koeficient ranga.

V: Kako je zapisana splošna formula za Spearmanov korelacijski koeficient ranga?


O: Splošna formula za Spearmanov koeficient korelacije ranga je zapisana kot ρ = 1 - 6∑d2/n(n2-1).

V: Kdaj je treba uporabiti Spearmanov korelacijski koeficient ranga?


O: Spearmanov koeficient korelacije ranga uporabite, kadar želite ugotoviti, kako tesno sta povezana dva niza podatkov in ali sta sploh povezana.

V: S katero vrsto podatkov deluje?


O: Deluje z vsemi vrstami podatkov, ki jih je mogoče razvrstiti po vrstnem redu, na primer od najvišjega do najnižjega.

V: Ali lahko navedete primer uporabe tega ukrepa?



O: Primer uporabe tega merila je, če imate podatke o tem, kako dragi so različni računalniki, in podatke o tem, kako hitri so računalniki, potem lahko s pomočjo r_s ugotovite, ali so povezani in kako tesno so povezani.

AlegsaOnline.com - 2020 / 2023 - License CC3