Rozkład normalny
Czym jest rozkład normalny
Rozkład normalny (zwany też rozkładem Gaussa lub krzywą dzwonową) to najważniejszy rozkład prawdopodobieństwa w statystyce. Ma kształt symetrycznej krzywej dzwonowej — wartości skupiają się wokół centrum, a im dalej od środka, tym rzadziej występują.
Dwa parametry w pełni go definiują:
- μ (mi) — średnia, wyznacza środek krzywej
- σ (sigma) — odchylenie standardowe, wyznacza szerokość krzywej; im większe σ, tym szersza i niższa krzywa
Kluczowa właściwość: w rozkładzie normalnym średnia = mediana = moda — wszystkie trzy miary środka są równe, co jest możliwe tylko przy pełnej symetrii.
Standardowy rozkład normalny to szczególny przypadek z μ = 0 i σ = 1. Dowolną zmienną normalną X można na niego przekształcić wzorem: z = (x − μ) / σ. Wynik z (zwany wynikiem z lub z-score) mówi, o ile odchyleń standardowych dana wartość odstaje od średniej.
Kiedy używać
Rozkład normalny jest założeniem wielu klasycznych testów statystycznych:
- testów t (dla średnich)
- ANOVY
- regresji liniowej (normalność reszt)
- przedziałów ufności dla średniej przy małych próbach
Wiele cech psychologicznych i biologicznych (wzrost, IQ, wyniki standaryzowanych testów na dużych próbach) w przybliżeniu spełnia to założenie. Jednak nie zakładaj normalności bez sprawdzenia — dane z małych prób, dochody, czasy reakcji czy wyniki ankiet porządkowych często mają rozkład skośny lub wielomodalny.
Jak interpretować
Reguła 68–95–99,7 (empiryczna reguła trzech sigm):
| Przedział | Udział obserwacji |
|---|---|
| μ ± 1σ | ok. 68% |
| μ ± 2σ | ok. 95% |
| μ ± 3σ | ok. 99,7% |
Przykład: jeśli wyniki testu IQ mają μ = 100 i σ = 15, to ok. 68% populacji uzyska wynik między 85 a 115, a 95% — między 70 a 130.
Jak sprawdzić normalność?
- Test Shapiro-Wilka — rekomendowany przy n < 50; istotny wynik (p < 0,05) wskazuje na odchylenie od normalności. Przy dużych próbach test staje się bardzo czuły na małe, praktycznie nieistotne odchylenia.
- Wykres Q-Q (quantile-quantile plot) — punkty powinny leżeć blisko linii prostej; silne S-kształty lub odgięcia na końcach sugerują skośność lub grube ogony.
- Parametry opisowe: skośność bliskie 0 i kurtoza (eksces) bliska 0 sprzyjają normalności, ale nie zastępują formalnego testu.
Przykład
Wyobraź sobie wyniki testu satysfakcji z pracy (0–100 pkt) zebrane od 200 pracowników: M = 62, SD = 11. Shapiro-Wilk: W = 0,993, p = 0,42 — brak podstaw do odrzucenia normalności. Wykres Q-Q bez wyraźnych odchyleń.
Wniosek: dane spełniają założenie normalności → możesz stosować testy t i ANOVĘ bez przekształceń.
Gdyby p < 0,05 i skośność wynosząca 1,8 wskazywały na prawostronną asymetrię, rozważ test nieparametryczny (Manna-Whitneya zamiast t) lub przekształcenie logarytmiczne.
Typowe błędy
- Przyjmowanie normalności bez weryfikacji — sam „dzwonowaty” wygląd histogramu to za mało; uruchom Shapiro-Wilka i sprawdź Q-Q plot.
- Mylenie rozkładu normalnego ze standardowym normalnym — każdy zestaw danych normalnych ma swoje własne μ i σ; standardowy rozkład (μ = 0, σ = 1) to tylko jeden szczególny przypadek.
- Odrzucanie normalności wyłącznie na podstawie p < 0,05 w Shapiro-Wilku przy dużej próbie — przy n > 200 test wykrywa odchylenia statystycznie istotne, ale merytorycznie pomijalne; patrz też na wykres Q-Q i na skośność.
- Stosowanie testów parametrycznych na skalach porządkowych — nawet jeśli wyniki ankiety Likerta wyglądają normalnie, skala jest porządkowa; rozważ testy nieparametryczne lub modele dla danych porządkowych.
Masz wątpliwości co do rozkładu swoich danych?
Sprawdzę normalność i doradzę, jakie testy zastosować — z gotowym opisem do metod pracy. Napisz do mnie →
Powiązane hasła
Autor: dr Błażej Mroziński, adiunkt SWPS. Aktualizacja: 19.06.2026.