Rozkład normalny

Czym jest rozkład normalny

Rozkład normalny (zwany też rozkładem Gaussa lub krzywą dzwonową) to najważniejszy rozkład prawdopodobieństwa w statystyce. Ma kształt symetrycznej krzywej dzwonowej — wartości skupiają się wokół centrum, a im dalej od środka, tym rzadziej występują.

Dwa parametry w pełni go definiują:

μ (mi) — średnia, wyznacza środek krzywej
σ (sigma) — odchylenie standardowe, wyznacza szerokość krzywej; im większe σ, tym szersza i niższa krzywa

Kluczowa właściwość: w rozkładzie normalnym średnia = mediana = moda — wszystkie trzy miary środka są równe, co jest możliwe tylko przy pełnej symetrii.

Standardowy rozkład normalny to szczególny przypadek z μ = 0 i σ = 1. Dowolną zmienną normalną X można na niego przekształcić wzorem: z = (x − μ) / σ. Wynik z (zwany wynikiem z lub z-score) mówi, o ile odchyleń standardowych dana wartość odstaje od średniej.

Kiedy używać

Rozkład normalny jest założeniem wielu klasycznych testów statystycznych:

testów t (dla średnich)
ANOVY
regresji liniowej (normalność reszt)
przedziałów ufności dla średniej przy małych próbach

Wiele cech psychologicznych i biologicznych (wzrost, IQ, wyniki standaryzowanych testów na dużych próbach) w przybliżeniu spełnia to założenie. Jednak nie zakładaj normalności bez sprawdzenia — dane z małych prób, dochody, czasy reakcji czy wyniki ankiet porządkowych często mają rozkład skośny lub wielomodalny.

Jak interpretować

Reguła 68–95–99,7 (empiryczna reguła trzech sigm):

Przedział	Udział obserwacji
μ ± 1σ	ok. 68%
μ ± 2σ	ok. 95%
μ ± 3σ	ok. 99,7%

Przykład: jeśli wyniki testu IQ mają μ = 100 i σ = 15, to ok. 68% populacji uzyska wynik między 85 a 115, a 95% — między 70 a 130.

Jak sprawdzić normalność?

Test Shapiro-Wilka — rekomendowany przy n < 50; istotny wynik (p < 0,05) wskazuje na odchylenie od normalności. Przy dużych próbach test staje się bardzo czuły na małe, praktycznie nieistotne odchylenia.
Wykres Q-Q (quantile-quantile plot) — punkty powinny leżeć blisko linii prostej; silne S-kształty lub odgięcia na końcach sugerują skośność lub grube ogony.
Parametry opisowe: skośność bliskie 0 i kurtoza (eksces) bliska 0 sprzyjają normalności, ale nie zastępują formalnego testu.

Przykład

Wyobraź sobie wyniki testu satysfakcji z pracy (0–100 pkt) zebrane od 200 pracowników: M = 62, SD = 11. Shapiro-Wilk: W = 0,993, p = 0,42 — brak podstaw do odrzucenia normalności. Wykres Q-Q bez wyraźnych odchyleń.

Wniosek: dane spełniają założenie normalności → możesz stosować testy t i ANOVĘ bez przekształceń.

Gdyby p < 0,05 i skośność wynosząca 1,8 wskazywały na prawostronną asymetrię, rozważ test nieparametryczny (Manna-Whitneya zamiast t) lub przekształcenie logarytmiczne.

Typowe błędy

Przyjmowanie normalności bez weryfikacji — sam „dzwonowaty” wygląd histogramu to za mało; uruchom Shapiro-Wilka i sprawdź Q-Q plot.
Mylenie rozkładu normalnego ze standardowym normalnym — każdy zestaw danych normalnych ma swoje własne μ i σ; standardowy rozkład (μ = 0, σ = 1) to tylko jeden szczególny przypadek.
Odrzucanie normalności wyłącznie na podstawie p < 0,05 w Shapiro-Wilku przy dużej próbie — przy n > 200 test wykrywa odchylenia statystycznie istotne, ale merytorycznie pomijalne; patrz też na wykres Q-Q i na skośność.
Stosowanie testów parametrycznych na skalach porządkowych — nawet jeśli wyniki ankiety Likerta wyglądają normalnie, skala jest porządkowa; rozważ testy nieparametryczne lub modele dla danych porządkowych.

Masz wątpliwości co do rozkładu swoich danych?

Sprawdzę normalność i doradzę, jakie testy zastosować — z gotowym opisem do metod pracy. Napisz do mnie →

Powiązane hasła

Autor: dr Błażej Mroziński, adiunkt SWPS. Aktualizacja: 19.06.2026.