Kwartyle
Czym są kwartyle
Kwartyle to trzy wartości progowe — Q1, Q2 i Q3 — które dzielą posortowany zbiór danych na cztery równoliczne ćwiartki:
- Q1 (pierwszy kwartyl, percentyl 25.) — 25% obserwacji leży poniżej tej wartości.
- Q2 (drugi kwartyl, percentyl 50.) — to po prostu mediana; połowa obserwacji jest poniżej, połowa powyżej.
- Q3 (trzeci kwartyl, percentyl 75.) — 75% obserwacji leży poniżej tej wartości.
Kwartyle należą do szerszej rodziny percentyli — Q1 to percentyl 25., Q2 to percentyl 50., Q3 to percentyl 75.
Rozstęp międzykwartylowy (IQR) = Q3 − Q1
IQR opisuje rozproszenie środkowych 50% danych. Jest odporny na wartości skrajne — nie zależy od tego, jak bardzo ekstremalne są obserwacje w ogonach rozkładu.
Reguła wykrywania wartości odstających (konwencja Tukeya):
- Dolna granica: Q1 − 1,5 × IQR
- Górna granica: Q3 + 1,5 × IQR
Obserwacje poza tymi granicami są oznaczane jako potencjalne wartości odstające. To ta sama konwencja, którą stosuje wykres skrzynkowy (boxplot).
Kiedy używać
Kwartyle stosujesz, gdy:
- dane są skośne lub zawierają wartości odstające — IQR jest wtedy bezpieczniejszą miarą rozproszenia niż odchylenie standardowe;
- skala jest porządkowa (np. Likert 1–7) i nie możesz zakładać równych odstępów między wartościami;
- chcesz podzielić uczestników na grupy (np. „niski — średni — wysoki wynik”) do analiz porównawczych;
- rysujesz boxplot — kwartyle to jego elementy konstrukcyjne.
Jak interpretować
| Miara | Co mówi |
|---|---|
| Q1 | 25% uczestników uzyskało wynik poniżej tej wartości |
| Q2 (mediana) | Połowa uczestników powyżej, połowa poniżej |
| Q3 | 75% uczestników uzyskało wynik poniżej tej wartości |
| IQR | Rozproszenie środkowych 50% obserwacji; mniejszy = dane bardziej skupione |
Szeroki IQR wskazuje na dużą zmienność w grupie; wąski IQR — na skupienie wyników.
Przykład
Dziewięcioro studentów uzyskało następujące wyniki testu (pkt):
24, 31, 35, 38, 42, 47, 53, 61, 78
n = 9 (nieparzyste), wyniki posortowane.
- Q2 (mediana) = wartość na pozycji (9+1)/2 = 5 → 42 pkt
- Q1 = mediana dolnej połowy (pozycje 1–4): (31+35)/2 = 33 pkt
- Q3 = mediana górnej połowy (pozycje 6–9): (47+53)/2 = 50 pkt
- IQR = 50 − 33 = 17 pkt
Dolna granica outlierów: 33 − 1,5 × 17 = 33 − 25,5 = 7,5 pkt (brak obserwacji poniżej) Górna granica outlierów: 50 + 1,5 × 17 = 50 + 25,5 = 75,5 pkt → wynik 78 pkt przekracza granicę i jest flagowany jako potencjalna wartość odstająca.
Uwaga: metody obliczania kwartyli różnią się między sobą (R oferuje 9 metod; SPSS i Excel też się różnią od siebie przy małych n). Przy małych zbiorach danych wartości Q1 i Q3 mogą nieznacznie różnić się w zależności od użytego oprogramowania — jest to normalne.
Typowe błędy
- Mylenie pozycji z wartością — Q1 to konkretna wartość danych (lub interpolowana), nie numer porządkowy obserwacji. Błąd polega na raportowaniu „Q1 = 3” mając na myśli „trzecia obserwacja”.
- Pomijanie sortowania — kwartyle wymagają posortowanego szeregu; obliczanie ich na nieposortowanych danych daje losowy wynik.
- Niespójność metod między programami — jeśli porównujesz wyniki z różnych narzędzi (np. R i Excel), sprawdź, którą metodę interpolacji stosuje każde z nich, szczególnie przy małym n.
- Używanie odchylenia standardowego zamiast IQR przy danych skośnych — gdy rozkład jest silnie asymetryczny, IQR i kwartyle są bardziej informatywne niż para (średnia ± SD).
Potrzebujesz pomocy z opisem rozproszenia danych?
Obliczę kwartyle i IQR, zidentyfikuję wartości odstające i przygotuję opis do sekcji wyników Twojej pracy. Dowiedz się więcej →
Powiązane hasła
Autor: dr Błażej Mroziński, adiunkt SWPS. Aktualizacja: 19.06.2026.