Test chi-kwadrat

Czym jest test chi-kwadrat

Test chi-kwadrat (χ²) to test statystyczny przeznaczony do danych kategorialnych (nominalnych i porządkowych). Najczęściej stosuje się go w dwóch celach:

Test niezależności (χ² Pearsona) — sprawdza, czy dwie zmienne kategorialne są niezależne, np. czy płeć wiąże się z wyborem kierunku studiów.
Test zgodności z rozkładem (goodness-of-fit) — sprawdza, czy rozkład jednej zmiennej odpowiada oczekiwanemu rozkładowi teoretycznemu.

W pracach magisterskich zdecydowanie dominuje wersja pierwsza — test niezależności na tablicy kontyngencji.

Statystyka χ² mierzy, jak bardzo częstości obserwowane (O) odbiegają od częstości oczekiwanych (E) przy założeniu braku związku:

χ² = suma [ (O − E)² / E ]

Częstości oczekiwane dla każdej komórki tablicy liczy się jako: E = (suma wiersza × suma kolumny) / n_całkowite.

Kiedy używać

Stosuj test χ² niezależności, gdy:

obie zmienne są kategorialne (nominalne lub porządkowe),
masz wystarczająco dużą próbę (patrz założenia poniżej),
obserwacje są niezależne — każda osoba trafia do dokładnie jednej komórki tablicy.

Nie stosuj χ² do zmiennych ciągłych bez uprzedniego kategoryzowania (i przemyśl, czy kategoryzowanie w ogóle ma sens).

Jak interpretować

Liczba stopni swobody dla tablicy kontyngencji r × c:

df = (liczba wierszy − 1) × (liczba kolumn − 1)

Kluczowe założenia:

Założenie	Co sprawdzić
Częstości oczekiwane ≥ 5 w każdej komórce	sprawdź w wynikach programu
Niezależność obserwacji	wynika z projektu badania
Minimalna liczebność próby	przy małych n użyj dokładnego testu Fishera

Gdy tablicy 2×2 towarzyszą małe liczebności (jakakolwiek E < 5), zamiast χ² Pearsona stosuj dokładny test Fishera — podają go wszystkie główne programy statystyczne.

Raportuj: χ²(df, N = n) = wartość, p = wartość. Dla tablicy 2×2 dołącz miarę siły związku phi (φ); dla tablic większych — V Craméra.

V Craméra	Interpretacja (df_min = 1)
0,10	mały związek
0,30	średni związek
0,50	silny związek

Przykład

Badasz, czy metoda nauki (tradycyjna vs e-learning) wiąże się z wynikiem egzaminu (zaliczony / niezaliczony) wśród 120 studentów.

Tablica 2×2 (obserwowane):

	Zaliczony	Niezaliczony	Suma
Tradycyjna	45	15	60
E-learning	33	27	60
Suma	78	42	120

Częstości oczekiwane: E₁₁ = (60 × 78)/120 = 39; E₁₂ = 21; E₂₁ = 39; E₂₂ = 21 — wszystkie ≥ 5, założenie spełnione.

χ²(1, N = 120) = 5,27, p = 0,022, φ = 0,21.

Wynik istotny statystycznie, choć efekt mały. Metoda nauki wiąże się ze zdawalnością, ale związek jest słaby.

Typowe błędy

Stosowanie χ² do danych ciągłych — test jest przeznaczony wyłącznie dla zmiennych kategorialnych.
Ignorowanie niskich częstości oczekiwanych — gdy E < 5, wynik χ² jest niewiarygodny; użyj testu Fishera.
Mylenie chi-kwadrat z miarą siły związku — istotne p mówi, że związek istnieje, ale nie jak silny; zawsze raportuj φ lub V Craméra.
Błędna interpretacja jako korelacja — χ² wykrywa zależność między zmiennymi, ale nie określa jej kierunku ani natury przyczynowej.

Potrzebujesz pomocy z analizą danych kategorialnych?

Zinterpretuję wyniki, dopasuję test do Twoich danych i przygotuję tabele gotowe do wklejenia w pracę. Dowiedz się więcej →

Powiązane hasła

Autor: dr Błażej Mroziński, adiunkt SWPS. Aktualizacja: 19.06.2026.