Test Manna-Whitneya (Mann i Whitney (1947) oraz Wilcoxon (1949)) służy do weryfikacji hipotezy o nieistotności różnic pomiędzy medianami badanej zmiennej w dwóch populacjach (przy czym zakładamy, że rozkłady zmiennej są sobie bliskie).
Podstawowe warunki stosowania:
pomiar na skali porządkowej (interwałowej),
model niezależny.
Hipotezy:
: θ1 = θ2,,
: θ1 ≠ θ2,
where:
θ1, θ2 – mediany badanej zmiennej w pierwszej i drugiej populacji.
Uwaga! Poprawkę na ciągłość testuManna-Whitneya (Marascuilo and McSweeney (1977)) stosujemy by zapewnić możliwość przyjmowania przez statystykę
testową wszystkich wartości liczb rzeczywistych zgodnie z założeniem rozkładu normalnego. Uwaga! Czasami (nie zakładając równości rozkładów), test ten bywa używany do badania równości nie tylko median, ale właśnie rozkładów.
Wyznaczoną na podstawie statystyki testowej wartość p porównujemy z poziomem istotności α:
Wysunięto hipotezę, że na pewnej uczelni studenci matematyki spędzają statystycznie
więcej czasu przed komputerem niż studentki matematyki. W celu weryfikacji tego przypuszczenia z populacji osób studiujących matematykę na tej uczelni wylosowano próbę liczącą 54 osoby (25 kobiet i 29 mężczyzn). Osoby te zapytano o to jak dużo czasu dziennie spędzają przy komputerze (czas w godzinach) i otrzymano następujące wyniki:
(czas, płeć): (2, k) (2, m) (2, m) (3, k) (3, k) (3, k) (3, k) (3, m) (3, m) (4, k) (4, k) (4, k) (4, k) (4, m) (4, m) (5, k) (5, k) (5, k) (5, k) (5, k) (5, k) (5, k) (5, k) (5, k) (5, m) (5, m) (5, m) (5, m) (6, k) (6, k) (6, k) (6, k) (6, k) (6, m) (6, m) (6, m) (6, m) (6, m) (6, m) (6, m) (6, m) (7, k) (7, m) (7, m) (7, m) (7, m) (7, m) (7, m) (7, m) (7, m) (7, m) (8, k) (8, m) (8, m).
Hipotezy:
H0 : mediana czasu spędzanego przed komputerem jest taka sama w populacji studentek i studentów badanej uczelni,
H1 : mediana czasu spędzanego przed komputerem jest inna dla populacji studentek i dla studentów badanej uczelni.
Na podstawie przyjętego poziomu α = 0.05 i statystyki Z testu Manna-Whitneya bez poprawki na ciągłość (p=0.015441) jak i z tą poprawką p = 0.015821, jak też na podstawie dokładnej statystyki U (p=0.014948) możemy przyjąć, że istnieją ważne statystycznie różnice pomiędzy studentkami a studentami matematyki w ilości czasu spędzanego przed komputerem. Różnice te polegają na tym, że studentki spędzają mniej czasu przed komputerem niż studenci (średnia rang dla kobiet wynosi 22.02 (mediana 5) i jest znacznie niższa niż średnia rang dla mężczyzn, która wynosi 32.22 (mediana 6)).