Korelacja Spearmana
Czym jest korelacja Spearmana
Współczynnik korelacji Spearmana (oznaczany ρ — greckie rho — lub r_s) mierzy, jak silnie i w jakim kierunku dwie zmienne współzmieniają się monotonicznie: gdy jedna rośnie, druga systematycznie rośnie (lub maleje) — niekoniecznie proporcjonalnie, jak wymaga korelacja Pearsona.
Obliczenie przebiega w dwóch krokach:
- Każdą zmienną zastępuje się jej rangą — obserwacje porządkuje się od najmniejszej do największej i przypisuje numery 1, 2, 3 … n (remisy — powiązania rang — otrzymują średnią rangę).
- Na rangach liczy się korelację Pearsona. Dla danych bez remisów istnieje uproszczony wzór:
r_s = 1 − (6 × suma d²) / (n × (n² − 1))
gdzie d = różnica rang dla każdej obserwacji, a n to liczba par.
Wynik mieści się w przedziale od −1 do +1, z identyczną interpretacją kierunku jak przy Pearsonie.
Kiedy używać
Sięgaj po korelację Spearmana, gdy:
- dane są na skali porządkowej (np. rankingi, skale Likerta z kilkoma stopniami)
- rozkład zmiennej jest wyraźnie skośny lub odbiega od normalnego
- w danych występują wartości odstające, które zniekształciłyby r Pearsona
- interesuje Cię związek monotoniczny, niekoniecznie liniowy (np. wraz z wiekiem satysfakcja rośnie, ale nie jednostajnie)
Jeśli obie zmienne są ciągłe i w przybliżeniu normalne, bez silnych wartości odstających, preferuj korelację Pearsona — ma nieco większą moc statystyczną w tych warunkach.
Jak interpretować
Poniższe progi są orientacyjne — konwencje różnią się między dziedzinami i autorami.
| |ρ| | Interpretacja | |---|---| | 0,00–0,30 | słaba | | 0,30–0,50 | umiarkowana | | 0,50–0,70 | wyraźna | | 0,70–0,90 | wysoka | | > 0,90 | bardzo wysoka |
Kierunek określa znak: ρ = −0,65 to wyraźna korelacja ujemna (gdy rośnie X, maleje Y, monotonicznie). Zawsze podawaj wartość p — przy dużej próbie (n > 100) nawet słaba korelacja może być istotna statystycznie, co nie przesądza o jej znaczeniu praktycznym.
Uwaga: ρ = 0 nie wyklucza związku niemonotonicznego (np. U-kształtnego).
Przykład
Badasz, czy oceny sędziów (skala porządkowa 1–10) dotyczące jakości prac dyplomowych zgadzają się z samooceną studentów (ta sama skala).
| Student | Ocena sędziego | Ranga S | Samoocena | Ranga O | d = Ranga S − Ranga O | d² |
|---|---|---|---|---|---|---|
| A | 8 | 5 | 7 | 4 | 1 | 1 |
| B | 9 | 6 | 9 | 6 | 0 | 0 |
| C | 6 | 3 | 8 | 5 | −2 | 4 |
| D | 4 | 1 | 3 | 1 | 0 | 0 |
| E | 5 | 2 | 5 | 2 | 0 | 0 |
| F | 7 | 4 | 6 | 3 | 1 | 1 |
suma d² = 6; n = 6
r_s = 1 − (6 · 6) / (6 · (36 − 1)) = 1 − 36/210 ≈ 1 − 0,17 = 0,83
Interpretacja: wysoka, dodatnia korelacja rangowa — sędziowie i studenci układali prace w zbliżonej kolejności. Zapis w pracy: „Korelacja rangowa Spearmana wykazała silną zgodność między ocenami zewnętrznymi a samooceną studentów, r_s(4) = 0,83, p = 0,04.”
(Stopnie swobody: n − 2 = 4.)
Typowe błędy
- Stosowanie na danych nominalnych — korelacja Spearmana wymaga danych co najmniej porządkowych; na kategoriach bez naturalnego porządku (np. zawód, kolor) wynik jest bezsensowny.
- Oczekiwanie wykrywania tylko związków liniowych — to zaleta Spearmana: wykrywa każdy związek monotoniczny, nie tylko liniowy. Nie oznacza to jednak wykrywania związków niemonotonicznych (np. krzywoliniowych odwróconego U).
- Ignorowanie remisów — gdy wiele obserwacji ma tę samą wartość (dużo remisów rang), uproszczony wzór daje przybliżony wynik; użyj wówczas wzoru ogólnego (korelacja Pearsona na rangach z korektą na remisy).
- Mylenie z testem Manna-Whitneya — oba są nieparametryczne i oparte na rangach, ale Mann-Whitney porównuje mediany dwóch grup, a Spearman mierzy siłę związku między dwiema zmiennymi.
Potrzebujesz pomocy z analizą korelacji?
Dobiorę właściwy współczynnik, sprawdzę założenia i opiszę wyniki gotowym akapitem do Twojej pracy. Zobacz usługi →
Powiązane hasła
Autor: dr Błażej Mroziński, adiunkt SWPS. Aktualizacja: 19.06.2026.