Test chi-kwadrat
Czym jest test chi-kwadrat
Test chi-kwadrat (χ²) to test statystyczny przeznaczony do danych kategorialnych (nominalnych i porządkowych). Najczęściej stosuje się go w dwóch celach:
- Test niezależności (χ² Pearsona) — sprawdza, czy dwie zmienne kategorialne są niezależne, np. czy płeć wiąże się z wyborem kierunku studiów.
- Test zgodności z rozkładem (goodness-of-fit) — sprawdza, czy rozkład jednej zmiennej odpowiada oczekiwanemu rozkładowi teoretycznemu.
W pracach magisterskich zdecydowanie dominuje wersja pierwsza — test niezależności na tablicy kontyngencji.
Statystyka χ² mierzy, jak bardzo częstości obserwowane (O) odbiegają od częstości oczekiwanych (E) przy założeniu braku związku:
χ² = suma [ (O − E)² / E ]
Częstości oczekiwane dla każdej komórki tablicy liczy się jako: E = (suma wiersza × suma kolumny) / n_całkowite.
Kiedy używać
Stosuj test χ² niezależności, gdy:
- obie zmienne są kategorialne (nominalne lub porządkowe),
- masz wystarczająco dużą próbę (patrz założenia poniżej),
- obserwacje są niezależne — każda osoba trafia do dokładnie jednej komórki tablicy.
Nie stosuj χ² do zmiennych ciągłych bez uprzedniego kategoryzowania (i przemyśl, czy kategoryzowanie w ogóle ma sens).
Jak interpretować
Liczba stopni swobody dla tablicy kontyngencji r × c:
df = (liczba wierszy − 1) × (liczba kolumn − 1)
Kluczowe założenia:
| Założenie | Co sprawdzić |
|---|---|
| Częstości oczekiwane ≥ 5 w każdej komórce | sprawdź w wynikach programu |
| Niezależność obserwacji | wynika z projektu badania |
| Minimalna liczebność próby | przy małych n użyj dokładnego testu Fishera |
Gdy tablicy 2×2 towarzyszą małe liczebności (jakakolwiek E < 5), zamiast χ² Pearsona stosuj dokładny test Fishera — podają go wszystkie główne programy statystyczne.
Raportuj: χ²(df, N = n) = wartość, p = wartość. Dla tablicy 2×2 dołącz miarę siły związku phi (φ); dla tablic większych — V Craméra.
| V Craméra | Interpretacja (df_min = 1) |
|---|---|
| 0,10 | mały związek |
| 0,30 | średni związek |
| 0,50 | silny związek |
Przykład
Badasz, czy metoda nauki (tradycyjna vs e-learning) wiąże się z wynikiem egzaminu (zaliczony / niezaliczony) wśród 120 studentów.
Tablica 2×2 (obserwowane):
| Zaliczony | Niezaliczony | Suma | |
|---|---|---|---|
| Tradycyjna | 45 | 15 | 60 |
| E-learning | 33 | 27 | 60 |
| Suma | 78 | 42 | 120 |
Częstości oczekiwane: E₁₁ = (60 × 78)/120 = 39; E₁₂ = 21; E₂₁ = 39; E₂₂ = 21 — wszystkie ≥ 5, założenie spełnione.
χ²(1, N = 120) = 5,27, p = 0,022, φ = 0,21.
Wynik istotny statystycznie, choć efekt mały. Metoda nauki wiąże się ze zdawalnością, ale związek jest słaby.
Typowe błędy
- Stosowanie χ² do danych ciągłych — test jest przeznaczony wyłącznie dla zmiennych kategorialnych.
- Ignorowanie niskich częstości oczekiwanych — gdy E < 5, wynik χ² jest niewiarygodny; użyj testu Fishera.
- Mylenie chi-kwadrat z miarą siły związku — istotne p mówi, że związek istnieje, ale nie jak silny; zawsze raportuj φ lub V Craméra.
- Błędna interpretacja jako korelacja — χ² wykrywa zależność między zmiennymi, ale nie określa jej kierunku ani natury przyczynowej.
Potrzebujesz pomocy z analizą danych kategorialnych?
Zinterpretuję wyniki, dopasuję test do Twoich danych i przygotuję tabele gotowe do wklejenia w pracę. Dowiedz się więcej →
Powiązane hasła
Autor: dr Błażej Mroziński, adiunkt SWPS. Aktualizacja: 19.06.2026.