Wykres skrzynkowy (boxplot)
Czym jest wykres skrzynkowy (boxplot)
Boxplot (wykres skrzynkowy, wykres pudełkowy) to jeden rysunek, który pokazuje jednocześnie centrum, rozproszenie, asymetrię i wartości odstające zbioru danych. Składa się z kilku elementów:
- Skrzynka (pudełko) — obejmuje środkowe 50% obserwacji, od Q1 do Q3. Wysokość skrzynki = IQR (rozstęp międzykwartylowy).
- Linia wewnątrz skrzynki — to mediana (Q2, percentyl 50.). Nie jest to średnia.
- Wąsy (whiskers) — linie wychodzące ze skrzynki w obu kierunkach. W najpopularniejszej konwencji (Tukey) sięgają do ostatniej obserwacji mieszczącej się w granicach Q1 − 1,5 × IQR (dolny wąs) i Q3 + 1,5 × IQR (górny wąs).
- Punkty poza wąsami — wartości odstające (outliers); oznaczane indywidualnie kropkami lub gwiazdkami.
Podsumowanie pięciu liczb (five-number summary): minimum wąsa, Q1, mediana, Q3, maksimum wąsa — to właśnie co boxplot wizualizuje. Uwaga: minimum i maksimum wąsów to nie zawsze absolutne minimum i maksimum zbioru, gdy są wartości odstające.
Kiedy używać
Boxplot jest idealny, gdy:
- porównujesz rozkłady między grupami (np. wyniki kobiet vs. mężczyzn, warunek eksperymentalny vs. kontrolny) — kilka boxplotów obok siebie to szybki przegląd;
- chcesz jednocześnie pokazać centrum, rozproszenie, asymetrię i wartości odstające bez wypełniania tabeli;
- dane są skośne lub zawierają outliery — boxplot radzi sobie z nimi lepiej niż wykres słupkowy średnich z błędami standardowymi;
- masz skalę porządkową lub ciągłą z co najmniej kilkunastoma obserwacjami.
Przy bardzo małym n (< 10 na grupę) boxplot może być mylący — mała skrzynka nie oznacza małej zmienności, tylko mało danych.
Jak interpretować
| Element | Co czytać |
|---|---|
| Położenie linii mediany | Centrum rozkładu (odporne na outliery) |
| Szerokość skrzynki (IQR) | Rozproszenie środkowych 50% — im szersza, tym większa zmienność |
| Asymetria linii mediany w skrzynce | Gdy linia bliżej Q1 → skośność prawostronna; bliżej Q3 → lewostronna |
| Długość wąsów | Rozproszenie wartości poza środkową połową |
| Punkty odstające | Potencjalne anomalie wymagające sprawdzenia |
Porównując dwie grupy: jeśli skrzynki nie nakładają się na siebie, grupy wyraźnie się różnią. Jeśli linia mediany jednej grupy leży poza skrzynką drugiej — różnica jest praktycznie istotna.
Przykład
Porównujesz wyniki testu stresu (0–100 pkt) w dwóch grupach (n = 30 każda):
- Grupa A (interwencja): skrzynka między 25 a 45 pkt, mediana = 34 pkt, wąsy do 12 i 58 pkt, brak outlierów.
- Grupa B (kontrolna): skrzynka między 40 a 65 pkt, mediana = 52 pkt, wąsy do 28 i 80 pkt, dwa outliery powyżej 90 pkt.
Odczyt: skrzynki prawie się nie nakładają — grupy wyraźnie różnią się poziomem stresu. Mediana grupy B (52) leży w górnej połowie skrzynki grupy A (25–45), co sugeruje skuteczność interwencji. Dwa outliery w grupie B warto sprawdzić pod kątem błędów pomiaru lub wyjątkowych przypadków.
Typowe błędy
- Czytanie linii środkowej jako średniej — linia wewnątrz skrzynki to mediana, nie średnia. To najczęstszy błąd interpretacyjny. Jeśli chcesz pokazać średnią, dodaj ją jako oddzielny symbol (np. krzyżyk lub diament).
- Ignorowanie punktów odstających — outliery często są wartościowe diagnostycznie (błąd pomiaru? ekstremalny przypadek kliniczny?). Nie pomijaj ich w opisie wyników.
- Porównywanie grup bardzo różnej wielkości bez ostrożności — boxplot wygląda identycznie dla n = 10 i n = 1000; mała skrzynka w małej grupie nie mówi tyle samo co mała skrzynka w dużej grupie. Podawaj n przy każdej grupie.
- Mylenie wąsów z zakresem absolutnym — wąsy NIE sięgają zawsze do minimum i maksimum; w standardowej konwencji Tukeya zatrzymują się przy ostatniej obserwacji w granicach 1,5 × IQR. Absolutne extrema pojawiają się jako osobne punkty, gdy wykraczają poza te granice.
Chcesz przejrzyste wykresy do swojej pracy lub raportu?
Przygotuję boxploty w R lub Pythonie gotowe do publikacji — z opisem interpretacyjnym i spójną szatą graficzną. Zobacz usługi →
Powiązane hasła
Autor: dr Błażej Mroziński, adiunkt SWPS. Aktualizacja: 19.06.2026.