Korelacja Pearsona
Czym jest korelacja Pearsona
Współczynnik korelacji Pearsona (r) opisuje, jak silnie i w jakim kierunku dwie zmienne ciągłe zmieniają się liniowo razem. Oblicza się go jako iloraz kowariancji zmiennych i iloczynu ich odchyleń standardowych:
r = suma [(xᵢ − x̄)(yᵢ − ȳ)] / pierwiastek z [suma (xᵢ − x̄)² · suma (yᵢ − ȳ)²]
Wynik zawsze mieści się w przedziale od −1 do +1:
- r = +1 — doskonały związek liniowy dodatni (gdy x rośnie, y rośnie proporcjonalnie)
- r = 0 — brak związku liniowego (mogą jednak istnieć związki nieliniowe)
- r = −1 — doskonały związek liniowy ujemny (gdy x rośnie, y maleje proporcjonalnie)
Kwadrat korelacji, r², informuje o tym, jaki odsetek wariancji jednej zmiennej jest wspólny z drugą. Np. r = 0,62 → r² = 0,38 → obie zmienne „dzielą” 38% wariancji.
Kiedy używać
Korelacja Pearsona jest odpowiednia, gdy:
- obie zmienne są ciągłe (interwałowe lub ilorazowe)
- związek między nimi ma charakter liniowy (sprawdź wykres punktowy przed obliczeniem)
- rozkłady zmiennych są w przybliżeniu normalne
- w danych nie ma skrajnych obserwacji silnie zaburzających wynik
Gdy te warunki nie są spełnione — np. skala jest porządkowa, rozkład silnie skośny lub obecne są wartości odstające — stosuj korelację Spearmana (współczynnik rang). Korelacja Pearsona nie wykrywa związków nieliniowych (np. krzywoliniowych): r ≈ 0 nie oznacza braku jakiegokolwiek związku.
Jak interpretować
Poniższe progi są orientacyjne; konwencje różnią się zależnie od dziedziny i autora.
| |r| | Interpretacja | |---|---| | 0,00–0,30 | słaba | | 0,30–0,50 | umiarkowana | | 0,50–0,70 | wyraźna | | 0,70–0,90 | wysoka | | > 0,90 | bardzo wysoka |
Kierunek określa znak: r = −0,62 to wyraźna korelacja ujemna. Zawsze podawaj wartość p — nawet słaba korelacja może być istotna statystycznie przy dużej próbie, co nie oznacza jej praktycznej ważności.
W regresji liniowej R² = r² w modelu z jednym predyktorem — te dwa wskaźniki są ze sobą ściśle powiązane.
Przykład
Badasz związek między wynikiem testu lęku (skala 0–60) a liczbą godzin snu na dobę u 90 studentów. Otrzymujesz r = −0,54 (p < 0,001).
Interpretacja: wyraźna, ujemna korelacja — studenci śpiący krócej uzyskiwali wyższe wyniki lęku. r² = 0,29 → liczba godzin snu wyjaśnia ok. 29% zmienności poziomu lęku.
Zapis w pracy: „Analiza wykazała wyraźny, ujemny związek między liczbą godzin snu a nasileniem lęku, r(88) = −0,54, p < 0,001”.
(Liczba w nawiasie to stopnie swobody: n − 2 = 88.)
Typowe błędy
- Korelacja nie oznacza przyczynowości — nawet wysoka wartość r nie dowodzi, że jedna zmienna powoduje zmiany drugiej. Zawsze bierz pod uwagę zmienne trzecie.
- Przeoczenie nieliniowości — jeśli wykres punktowy sugeruje kształt krzywoliniowy (np. odwrócone U), r Pearsona może być bliskie zeru mimo silnego związku. Zawsze patrz na wykres.
- Wrażliwość na wartości odstające — jedna skrajna obserwacja może wyraźnie zawyżyć lub zaniżyć r. Sprawdź dane przed interpretacją lub zastosuj Spearmana.
- Zbyt małe próby — przy n < 30 korelacja jest bardzo niestabilna i łatwo przypadkowo uzyska wynik istotny statystycznie; interpretuj ostrożnie.
- Mylenie r z r² — r = 0,50 to „umiarkowana” korelacja, ale r² = 0,25 oznacza tylko 25% wspólnej wariancji. To różne informacje.
Potrzebujesz pomocy z interpretacją korelacji?
Policzę współczynnik, zweryfikuję założenia i opiszę wyniki w języku, który przejdzie recenzję. Sprawdź, co oferuję →
Powiązane hasła
Autor: dr Błażej Mroziński, adiunkt SWPS. Aktualizacja: 19.06.2026.