Dominanta pojawia się wszędzie tam, gdzie pracuje się z danymi: w zadaniach z matematyki, w statystyce na studiach, przy analizie wyników testów czy sprzedaży. Osoby, które zaczynają przygodę z analizą danych, zwykle szukają prostego wyjaśnienia, jak obliczyć dominantę na konkretnych przykładach, a nie suchej definicji z podręcznika. Poniżej znajduje się zwięzłe wyjaśnienie, jak liczyć dominantę w różnych sytuacjach, jak ją rozpoznać w tabelach i na wykresach oraz jak radzić sobie z danymi, które nie są „idealne”. To materiał dla osób, które chcą zacząć liczyć dominantę samodzielnie i rozumieć, co tak naprawdę mówi o danych.
Co to jest dominanta – szybkie wyjaśnienie na przykładzie
Dominanta (moda) to taka wartość w zbiorze danych, która występuje najczęściej. Tyle teorii. W praktyce liczy się to tak:
Przykład: wyniki testu (w punktach) w klasie:
2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6
Liczba wystąpień:
- 2 – raz
- 3 – trzy razy
- 4 – dwa razy
- 5 – cztery razy
- 6 – raz
Dominanta = 5, bo ta wartość pojawia się najczęściej (4 razy).
Dominanta to najprostsza miara statystyczna do „wyczucia”, jaki wynik lub wartość jest w danych najbardziej typowa – w sensie najczęściej powtarzająca się, a nie „średnia”.
W odróżnieniu od średniej arytmetycznej, dominanta nie „rozmywa się” przez wartości skrajne. W przykładzie powyżej nawet gdyby jedna osoba dostała 100 punktów, dominanta nadal byłaby równa 5, bo 5 występuje najczęściej.
Jak obliczyć dominantę w prostym zbiorze danych (krok po kroku)
Najpierw wersja najprostsza – dane surowe, czyli po prostu lista liczb bez tabel, grupowania i kombinacji.
Przykład 1: dominanta w małym zbiorze liczb
Dane: liczba książek przeczytanych w miesiącu przez 10 osób:
0, 1, 1, 2, 2, 2, 3, 4, 4, 5
Kroki:
- Uporządkować dane niemalejąco (tutaj już są).
- Policzyć, ile razy występuje każda wartość.
Liczność:
- 0 – 1 raz
- 1 – 2 razy
- 2 – 3 razy
- 3 – 1 raz
- 4 – 2 razy
- 5 – 1 raz
Najwięcej wystąpień: 2 (trzy razy), więc:
Dominanta = 2
Przykład 2: zbiór bez dominanty
Dane: wyniki rzutów kostką:
1, 2, 3, 4, 5, 6
Każda wartość występuje dokładnie raz. Brak jednej, wyraźnie najczęściej występującej wartości.
W takim przypadku mówi się, że:
Dominanta nie istnieje (brak dominanty)
Przykład 3: zbiór z dwiema dominantami (bimodalny)
Dane: liczba kaw wypijanych dziennie w biurze:
0, 1, 1, 2, 2, 3, 3, 3, 4, 4
Liczność:
- 0 – 1 raz
- 1 – 2 razy
- 2 – 2 razy
- 3 – 3 razy
- 4 – 2 razy
Najczęściej występuje 3 (trzy razy), więc dominanta to 3. Teraz przykład faktycznie z dwiema dominantami:
Dane: 0, 1, 1, 2, 2, 3, 3, 4
Liczność:
- 1 – 2 razy
- 2 – 2 razy
- 3 – 2 razy
Trzy różne wartości mają tę samą, największą częstość. W takiej sytuacji stosuje się opis:
Zbiór wielomodalny, dominanty: 1, 2, 3
Jeżeli kilka wartości występuje równie często i są to jednocześnie częstotliwości maksymalne, zbiór ma kilka dominant. W praktyce szkolnej zwykle prosi się o wymienienie wszystkich takich wartości.
Dominanta w tabeli z częstościami
W zadaniach szkolnych dominanta często pojawia się nie w surowej liście, ale w tabeli:
Przykład 4: dominanta z tabeli
Tabela: liczba błędów w dyktandzie u 20 uczniów.
| Liczba błędów | Liczba uczniów |
|---|---|
| 0 | 1 |
| 1 | 3 |
| 2 | 6 |
| 3 | 7 |
| 4 | 3 |
Tutaj najpierw patrzy się na to, która liczba uczniów (częstość) jest największa:
- 1 uczeń
- 3 uczniów
- 6 uczniów
- 7 uczniów
- 3 uczniów
Największa wartość to 7 uczniów, więc dominanta to odpowiadająca jej liczba błędów:
Dominanta = 3 błędy
Przy tabelach grupowych (z przedziałami) sytuacja jest trochę inna – wtedy dominanta to nie konkretna liczba, tylko przedział dominujący.
Przykład 5: dominanta w przedziałach (dane pogrupowane)
Tabela: miesięczne wydatki (w zł) 40 osób, dane pogrupowane:
| Wydatki (zł) | Liczba osób |
|---|---|
| 0–199 | 5 |
| 200–399 | 12 |
| 400–599 | 17 |
| 600–799 | 4 |
| 800–999 | 2 |
Największa częstość: 17 osób w przedziale 400–599 zł.
W takim przypadku mówi się:
Przedział dominanty: 400–599 zł
W statystyce ciągłej można jeszcze obliczyć przybliżoną wartość dominanty w tym przedziale, ale w większości zadań szkolnych wystarczy wskazać cały przedział.
Dominanta a średnia i mediana – w czym jest inna
Dominanta to tylko jedna z trzech podstawowych miar położenia: obok średniej i median. Każda mówi coś trochę innego o danych.
- Średnia – wrażliwa na wartości skrajne; kilka bardzo dużych lub bardzo małych wartości może ją mocno przesunąć.
- Mediana – wartość „środkowa” po uporządkowaniu danych; dobrze oddaje „połowę” rozkładu.
- Dominanta – najczęściej występująca wartość; mocno związana z praktycznym „typowym wynikiem”.
Przykład porównawczy:
Dane: płace (w tys. zł):
3, 3, 3, 4, 4, 20
Obliczenia:
- Średnia = (3 + 3 + 3 + 4 + 4 + 20) / 6 = 37 / 6 ≈ 6,17 tys.
- Mediana – średnia z dwóch środkowych (3, 4) = 3,5 tys.
- Dominanta – najczęściej: 3 tys.
Widać różnicę: jedna osoba z pensją 20 000 zł „wyciąga” średnią w górę, ale dominanta pozostaje przy 3 000 zł, co lepiej oddaje sytuację większości.
W danych z silnymi wartościami odstającymi (np. zarobki, ceny mieszkań) dominanta i mediana często dają bardziej „ludzkie” wyobrażenie o typowej wartości niż średnia arytmetyczna.
Dominanta w danych jakościowych – nie tylko liczby
Dominanta nie dotyczy tylko liczb. Można ją liczyć także dla danych opisowych: kolorów, marek, odpowiedzi ankietowych.
Przykład 6: dominanta w odpowiedziach ankietowych
Pytanie w ankiecie: „Najczęściej wybierany środek transportu do pracy?”
Odpowiedzi (20 osób):
samochód, samochód, autobus, rower, rower, rower, autobus, pieszo, samochód, samochód, rower, autobus, samochód, tramwaj, rower, rower, samochód, autobus, autobus, rower
Liczenie bez formalnej tabeli:
- samochód – 6 razy
- rower – 7 razy
- autobus – 5 razy
- pieszo – 1 raz
- tramwaj – 1 raz
Najczęściej: rower (7 razy).
Dominanta = rower
W takich danych nie ma średniej ani mediany (bo nie ma naturalnego porządku liczbowego), ale dominanta jak najbardziej ma sens.
Najczęstsze pułapki przy liczeniu dominanty
Na pozór dominanta jest prosta, ale w zadaniach często pojawiają się powtarzające się błędy.
Pułapka 1: mylenie „największej wartości” z „najczęściej występującą”
Dane: 1, 1, 1, 2, 2, 100
Największa wartość to 100, ale występuje tylko raz. Najczęściej pojawia się 1, więc dominanta to 1, a nie 100.
Pułapka 2: ignorowanie braku dominanty
Dane: 2, 3, 4, 5
Każda wartość występuje raz. W takim zbiorze nie da się uczciwie wskazać jednej „najczęstszej” wartości. Poprawne sformułowanie:
Zbiór nie ma dominanty
Pułapka 3: „wymuszanie” jednej dominanty tam, gdzie są dwie lub więcej
Dane: 1, 1, 2, 2, 3
1 i 2 występują po dwa razy, czyli najczęściej. Poprawna odpowiedź:
Dwie dominanty: 1 i 2 (zbiór dwumodalny)
Pułapka 4: patrzenie na złe kolumny w tabeli
W tabelach częstą pomyłką jest wybieranie największej wartości zmiennej, a nie częstości. Zawsze należy:
- Najpierw znaleźć największą częstość (liczbę obserwacji).
- Dopiero potem odczytać wartość zmiennej lub przedział, który tej częstości odpowiada.
Jak szybko znaleźć dominantę w praktyce (kilka prostych trików)
Na co dzień nie zawsze liczy się wszystko „pod linijkę”. Wiele rzeczy można zrobić na oko – byle świadomie.
- Przy małych zbiorach (do kilkunastu elementów) warto dane spisać w kolejności niemalejącej – dominanta „wyskoczy” sama jako najdłuższy „ciąg” tych samych wartości.
- Przy większych zbiorach (kilkadziesiąt/kilkaset elementów) dobrze jest zbudować prostą tabelę częstości (wartość – liczba wystąpień) i wtedy wybrać maksimum.
- Przy danych opisowych (np. kolory, odpowiedzi ankietowe) też warto dążyć do tabeli – kartka, kolumny, szybkie podliczenie „kreseczkami”.
Dla uczniów i studentów dominanta jest zwykle pierwszą miarą, którą da się policzyć „z głowy”, bez kalkulatora. W realnych danych (sprzedaż, wyniki, odpowiedzi klientów) pozwala szybko zobaczyć, co jest najpopularniejsze: najczęściej kupowany produkt, najczęstsza ocena, najczęściej wybierana opcja.
Do sprawnego liczenia dominanty wystarczy nawyk: najpierw policzyć częstości, dopiero potem podejmować decyzję, czy w ogóle istnieje jedna wyraźna dominanta, czy może zbiór jest wielomodalny albo nie ma dominanty wcale.
