Spearmanov koeficient korelacije
V matematiki in statistiki je Spearmanov koeficient korelacije merilo korelacije, poimenovano po njegovem avtorju Charlesu Spearmanu. Na kratko se zapiše kot grška črka rho ( ρ {\displaystyle \rho } ) ali včasih kot r s {\displaystyle r_{s}}. . To je število, ki kaže, kako tesno sta povezana dva niza podatkov. Uporablja se lahko samo za podatke, ki jih je mogoče razvrstiti po vrstnem redu, na primer od najvišjega do najnižjega.
Splošna formula za r s {\displaystyle r_{s}} je ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} .
Če imate na primer podatke o tem, kako dragi so različni računalniki, in podatke o tem, kako hitri so računalniki, lahko s pomočjo r s {\displaystyle r_{s}} ugotovite, ali so računalniki povezani in kako tesno so povezani. .
Delo se je začelo
Prvi korak
Za določitev r s {\displaystyle r_{s}} morate najprej razvrstiti vsak podatek. Uporabili bomo primer iz uvoda o računalnikih in njihovi hitrosti.
Računalnik z najnižjo ceno je torej uvrščen na prvo mesto. Tisti, ki je višji od njega, bi bil na 2. mestu. Nato se vrstijo, dokler se ne razvrstijo vsi računalniki. To morate storiti za oba niza podatkov.
Cena ($) | R a n k 1 {\displaystyle Rank_{1}} | Hitrost (GHz) | R a n k 2 {\displaystyle Rank_{2}} | |
A | 200 | 1 | 1.80 | 2 |
B | 275 | 2 | 1.60 | 1 |
C | 300 | 3 | 2.20 | 4 |
D | 350 | 4 | 2.10 | 3 |
E | 600 | 5 | 4.00 | 5 |
Drugi korak
Nato moramo poiskati razliko med obema vrstama. Razliko nato pomnožimo s samim seboj, kar imenujemo kvadratura. Razliko imenujemo d {\displaystyle d} , število, ki ga dobimo, ko d {\displaystyle d} kvadriramo, pa imenujemo d 2 {\displaystyle d^{2}}. .
R a n k 1 {\displaystyle Rank_{1}} | R a n k 2 {\displaystyle Rank_{2}} | d {\displaystyle d} | d 2 {\displaystyle d^{2}} |
1 | 2 | -1 | 1 |
2 | 1 | 1 | 1 |
3 | 4 | -1 | 1 |
4 | 3 | 1 | 1 |
5 | 5 | 0 | 0 |
Tretji korak
Preštejte, koliko podatkov imamo. Ti podatki imajo stopnje od 1 do 5, torej imamo 5 podatkov. To število se imenuje n {\displaystyle n} .
Četrti korak
Na koncu uporabite vse, kar smo do zdaj ugotovili, v tej formuli: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} .
∑ d 2 {\displaystyle \sum d^{2}} pomeni, da vzamemo vsoto vseh številk, ki so bile v stolpcu d 2 {\displaystyle d^{2}} . To pa zato, ker ∑ {\displaystyle \sum } pomeni skupaj.
Torej je ∑ d 2 {\displaystyle \sum d^{2}} 1 + 1 + 1 + 1 + 1 {\displaystyle 1+1+1+1}, kar je 4. Formula pravi, da ga pomnožimo s 6, kar je 24.
n ( n 2 - 1 ) {\displaystyle n(n^{2}-1)} je 5 × ( 25 - 1 ) {\displaystyle 5\krat (25-1)}, kar je 120.
Da bi ugotovili r s {\displaystyle r_{s}} preprosto naredimo 1 - 24 120 = 0,8 {\displaystyle 1-{\cfrac {24}{120}}=0,8} .
Zato je Spearmanov koeficient korelacije za ta niz podatkov 0,8.
Kaj pomenijo številke
r s {\displaystyle r_{s}} vedno daje odgovor med -1 in 1. Številke med njima so kot lestvica, kjer je -1 zelo močna povezava, 0 je brez povezave, 1 pa je prav tako zelo močna povezava. Razlika med 1 in -1 je v tem, da je 1 pozitivna povezava, -1 pa je negativna povezava. Graf podatkov z vrednostjo r s {\displaystyle r_{s}} -1 bi bil podoben prikazanemu grafu, le da bi črta in točke potekale od leve zgoraj proti desni spodaj.
Na primer, za podatke, ki smo jih obdelali zgoraj, je r s {\displaystyle r_{s}} znašal 0,8. To pomeni, da obstaja pozitivna korelacija. Ker je blizu vrednosti 1, to pomeni, da je povezava med obema nizoma podatkov močna. Torej lahko rečemo, da sta ta dva niza podatkov povezana in se skupaj dvigujeta. Če bi bila -0,8, bi lahko rekli, da sta povezana in da ko se eden povečuje, se drugi zmanjšuje.
Če sta dve števili enaki
Pri razvrščanju podatkov se včasih zgodi, da sta dve ali več številk enakih. Kadar se to zgodi v r s {\displaystyle r_{s}} , vzamemo povprečje ali sredino rangov, ki so enaki. To so tako imenovani vezani rangi. To storimo tako, da vezana števila razvrstimo, kot da ne bi bila vezana. Nato seštejemo vse rangove, ki bi jih imeli, in jih delimo s številom, kolikor jih je. Recimo, da razvrščamo, kako dobro so se različni ljudje odrezali na testu pravopisa.
Rezultat testa | Rang | Položaj (z vezanimi) |
4 | 1 | 1 |
6 | 2 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3} |
6 | 3 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3} |
6 | 4 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3} |
8 | 5 | 5 + 6 2 = 5,5 {\displaystyle {\tfrac {5+6}{2}}=5,5} |
8 | 6 | 5 + 6 2 = 5,5 {\displaystyle {\tfrac {5+6}{2}}=5,5} |
Te številke se uporabljajo na enak način kot običajne stopnje.
Sorodne strani
Vprašanja in odgovori
V: Kaj je Spearmanov koeficient korelacije?
O: Spearmanov koeficient korelacije ranga je mera korelacije, ki kaže, kako tesno sta povezana dva niza podatkov. Uporablja se lahko samo za podatke, ki jih je mogoče razvrstiti po vrstnem redu, na primer od najvišjega do najnižjega.
V: Kdo je ustvaril Spearmanov korelacijski koeficient ranga?
O: Charles Spearman je ustvaril Spearmanov korelacijski koeficient ranga.
V: Kako je zapisana splošna formula za Spearmanov korelacijski koeficient ranga?
O: Splošna formula za Spearmanov koeficient korelacije ranga je zapisana kot ρ = 1 - 6∑d2/n(n2-1).
V: Kdaj je treba uporabiti Spearmanov korelacijski koeficient ranga?
O: Spearmanov koeficient korelacije ranga uporabite, kadar želite ugotoviti, kako tesno sta povezana dva niza podatkov in ali sta sploh povezana.
V: S katero vrsto podatkov deluje?
O: Deluje z vsemi vrstami podatkov, ki jih je mogoče razvrstiti po vrstnem redu, na primer od najvišjega do najnižjega.
V: Ali lahko navedete primer uporabe tega ukrepa?
O: Primer uporabe tega merila je, če imate podatke o tem, kako dragi so različni računalniki, in podatke o tem, kako hitri so računalniki, potem lahko s pomočjo r_s ugotovite, ali so povezani in kako tesno so povezani.