Jak obliczyć dominantę – praktyczne przykłady z rozwiązaniami

Dominanta pojawia się wszędzie tam, gdzie pracuje się z danymi: w zadaniach z matematyki, w statystyce na studiach, przy analizie wyników testów czy sprzedaży. Osoby, które zaczynają przygodę z analizą danych, zwykle szukają prostego wyjaśnienia, jak obliczyć dominantę na konkretnych przykładach, a nie suchej definicji z podręcznika. Poniżej znajduje się zwięzłe wyjaśnienie, jak liczyć dominantę w różnych sytuacjach, jak ją rozpoznać w tabelach i na wykresach oraz jak radzić sobie z danymi, które nie są „idealne”. To materiał dla osób, które chcą zacząć liczyć dominantę samodzielnie i rozumieć, co tak naprawdę mówi o danych.

Co to jest dominanta – szybkie wyjaśnienie na przykładzie

Dominanta (moda) to taka wartość w zbiorze danych, która występuje najczęściej. Tyle teorii. W praktyce liczy się to tak:

Przykład: wyniki testu (w punktach) w klasie:

2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6

Liczba wystąpień:

  • 2 – raz
  • 3 – trzy razy
  • 4 – dwa razy
  • 5 – cztery razy
  • 6 – raz

Dominanta = 5, bo ta wartość pojawia się najczęściej (4 razy).

Dominanta to najprostsza miara statystyczna do „wyczucia”, jaki wynik lub wartość jest w danych najbardziej typowa – w sensie najczęściej powtarzająca się, a nie „średnia”.

W odróżnieniu od średniej arytmetycznej, dominanta nie „rozmywa się” przez wartości skrajne. W przykładzie powyżej nawet gdyby jedna osoba dostała 100 punktów, dominanta nadal byłaby równa 5, bo 5 występuje najczęściej.

Jak obliczyć dominantę w prostym zbiorze danych (krok po kroku)

Najpierw wersja najprostsza – dane surowe, czyli po prostu lista liczb bez tabel, grupowania i kombinacji.

Przykład 1: dominanta w małym zbiorze liczb

Dane: liczba książek przeczytanych w miesiącu przez 10 osób:

0, 1, 1, 2, 2, 2, 3, 4, 4, 5

Kroki:

  1. Uporządkować dane niemalejąco (tutaj już są).
  2. Policzyć, ile razy występuje każda wartość.

Liczność:

  • 0 – 1 raz
  • 1 – 2 razy
  • 2 – 3 razy
  • 3 – 1 raz
  • 4 – 2 razy
  • 5 – 1 raz

Najwięcej wystąpień: 2 (trzy razy), więc:

Dominanta = 2

Przykład 2: zbiór bez dominanty

Dane: wyniki rzutów kostką:

1, 2, 3, 4, 5, 6

Każda wartość występuje dokładnie raz. Brak jednej, wyraźnie najczęściej występującej wartości.

W takim przypadku mówi się, że:

Dominanta nie istnieje (brak dominanty)

Przykład 3: zbiór z dwiema dominantami (bimodalny)

Dane: liczba kaw wypijanych dziennie w biurze:

0, 1, 1, 2, 2, 3, 3, 3, 4, 4

Liczność:

  • 0 – 1 raz
  • 1 – 2 razy
  • 2 – 2 razy
  • 3 – 3 razy
  • 4 – 2 razy

Najczęściej występuje 3 (trzy razy), więc dominanta to 3. Teraz przykład faktycznie z dwiema dominantami:

Dane: 0, 1, 1, 2, 2, 3, 3, 4

Liczność:

  • 1 – 2 razy
  • 2 – 2 razy
  • 3 – 2 razy

Trzy różne wartości mają tę samą, największą częstość. W takiej sytuacji stosuje się opis:

Zbiór wielomodalny, dominanty: 1, 2, 3

Jeżeli kilka wartości występuje równie często i są to jednocześnie częstotliwości maksymalne, zbiór ma kilka dominant. W praktyce szkolnej zwykle prosi się o wymienienie wszystkich takich wartości.

Dominanta w tabeli z częstościami

W zadaniach szkolnych dominanta często pojawia się nie w surowej liście, ale w tabeli:

Przykład 4: dominanta z tabeli

Tabela: liczba błędów w dyktandzie u 20 uczniów.

Liczba błędów Liczba uczniów
0 1
1 3
2 6
3 7
4 3

Tutaj najpierw patrzy się na to, która liczba uczniów (częstość) jest największa:

  • 1 uczeń
  • 3 uczniów
  • 6 uczniów
  • 7 uczniów
  • 3 uczniów

Największa wartość to 7 uczniów, więc dominanta to odpowiadająca jej liczba błędów:

Dominanta = 3 błędy

Przy tabelach grupowych (z przedziałami) sytuacja jest trochę inna – wtedy dominanta to nie konkretna liczba, tylko przedział dominujący.

Przykład 5: dominanta w przedziałach (dane pogrupowane)

Tabela: miesięczne wydatki (w zł) 40 osób, dane pogrupowane:

Wydatki (zł) Liczba osób
0–199 5
200–399 12
400–599 17
600–799 4
800–999 2

Największa częstość: 17 osób w przedziale 400–599 zł.

W takim przypadku mówi się:

Przedział dominanty: 400–599 zł

W statystyce ciągłej można jeszcze obliczyć przybliżoną wartość dominanty w tym przedziale, ale w większości zadań szkolnych wystarczy wskazać cały przedział.

Dominanta a średnia i mediana – w czym jest inna

Dominanta to tylko jedna z trzech podstawowych miar położenia: obok średniej i median. Każda mówi coś trochę innego o danych.

  • Średnia – wrażliwa na wartości skrajne; kilka bardzo dużych lub bardzo małych wartości może ją mocno przesunąć.
  • Mediana – wartość „środkowa” po uporządkowaniu danych; dobrze oddaje „połowę” rozkładu.
  • Dominanta – najczęściej występująca wartość; mocno związana z praktycznym „typowym wynikiem”.

Przykład porównawczy:

Dane: płace (w tys. zł):

3, 3, 3, 4, 4, 20

Obliczenia:

  • Średnia = (3 + 3 + 3 + 4 + 4 + 20) / 6 = 37 / 6 ≈ 6,17 tys.
  • Mediana – średnia z dwóch środkowych (3, 4) = 3,5 tys.
  • Dominanta – najczęściej: 3 tys.

Widać różnicę: jedna osoba z pensją 20 000 zł „wyciąga” średnią w górę, ale dominanta pozostaje przy 3 000 zł, co lepiej oddaje sytuację większości.

W danych z silnymi wartościami odstającymi (np. zarobki, ceny mieszkań) dominanta i mediana często dają bardziej „ludzkie” wyobrażenie o typowej wartości niż średnia arytmetyczna.

Dominanta w danych jakościowych – nie tylko liczby

Dominanta nie dotyczy tylko liczb. Można ją liczyć także dla danych opisowych: kolorów, marek, odpowiedzi ankietowych.

Przykład 6: dominanta w odpowiedziach ankietowych

Pytanie w ankiecie: „Najczęściej wybierany środek transportu do pracy?”

Odpowiedzi (20 osób):

samochód, samochód, autobus, rower, rower, rower, autobus, pieszo, samochód, samochód, rower, autobus, samochód, tramwaj, rower, rower, samochód, autobus, autobus, rower

Liczenie bez formalnej tabeli:

  • samochód – 6 razy
  • rower – 7 razy
  • autobus – 5 razy
  • pieszo – 1 raz
  • tramwaj – 1 raz

Najczęściej: rower (7 razy).

Dominanta = rower

W takich danych nie ma średniej ani mediany (bo nie ma naturalnego porządku liczbowego), ale dominanta jak najbardziej ma sens.

Najczęstsze pułapki przy liczeniu dominanty

Na pozór dominanta jest prosta, ale w zadaniach często pojawiają się powtarzające się błędy.

Pułapka 1: mylenie „największej wartości” z „najczęściej występującą”

Dane: 1, 1, 1, 2, 2, 100

Największa wartość to 100, ale występuje tylko raz. Najczęściej pojawia się 1, więc dominanta to 1, a nie 100.

Pułapka 2: ignorowanie braku dominanty

Dane: 2, 3, 4, 5

Każda wartość występuje raz. W takim zbiorze nie da się uczciwie wskazać jednej „najczęstszej” wartości. Poprawne sformułowanie:

Zbiór nie ma dominanty

Pułapka 3: „wymuszanie” jednej dominanty tam, gdzie są dwie lub więcej

Dane: 1, 1, 2, 2, 3

1 i 2 występują po dwa razy, czyli najczęściej. Poprawna odpowiedź:

Dwie dominanty: 1 i 2 (zbiór dwumodalny)

Pułapka 4: patrzenie na złe kolumny w tabeli

W tabelach częstą pomyłką jest wybieranie największej wartości zmiennej, a nie częstości. Zawsze należy:

  1. Najpierw znaleźć największą częstość (liczbę obserwacji).
  2. Dopiero potem odczytać wartość zmiennej lub przedział, który tej częstości odpowiada.

Jak szybko znaleźć dominantę w praktyce (kilka prostych trików)

Na co dzień nie zawsze liczy się wszystko „pod linijkę”. Wiele rzeczy można zrobić na oko – byle świadomie.

  • Przy małych zbiorach (do kilkunastu elementów) warto dane spisać w kolejności niemalejącej – dominanta „wyskoczy” sama jako najdłuższy „ciąg” tych samych wartości.
  • Przy większych zbiorach (kilkadziesiąt/kilkaset elementów) dobrze jest zbudować prostą tabelę częstości (wartość – liczba wystąpień) i wtedy wybrać maksimum.
  • Przy danych opisowych (np. kolory, odpowiedzi ankietowe) też warto dążyć do tabeli – kartka, kolumny, szybkie podliczenie „kreseczkami”.

Dla uczniów i studentów dominanta jest zwykle pierwszą miarą, którą da się policzyć „z głowy”, bez kalkulatora. W realnych danych (sprzedaż, wyniki, odpowiedzi klientów) pozwala szybko zobaczyć, co jest najpopularniejsze: najczęściej kupowany produkt, najczęstsza ocena, najczęściej wybierana opcja.

Do sprawnego liczenia dominanty wystarczy nawyk: najpierw policzyć częstości, dopiero potem podejmować decyzję, czy w ogóle istnieje jedna wyraźna dominanta, czy może zbiór jest wielomodalny albo nie ma dominanty wcale.