Statystyka Testy parametryczne ANOVA dla grup niezależnych
Jednoczynnikowa analiza wariancji (ANOVA) dla grup niezależnych zaproponowana przez Ronalda Fishera, służy do weryfikacji hipotezy o równości średnich badanej zmiennej w kilku (k>=2) populacjach.
Podstawowe warunki stosowania:
pomiar na skali interwałowej,
normalność rozkładu badanej zmiennej w każdej populacji,
model niezależny,
równość wariancji badanej zmiennej wszystkich populacji.
Hipotezy:
:
µ1 = µ2 = ... = µk dla wszystkich kategorii,
:
nie wszystkie µj są równe (j = 1, 2, ..., k),
gdzie:
µ1µ2,...,µk – średnie badanej zmiennej w populacjach, z których pobrano próby.
Kontrasty i testy POST-HOC dostępne w ANOVA dla grup niezależnych:
test LSD Fishera,
test Scheffego,
test Tukeya.
Wyznaczoną na podstawie statystyki testowej wartość p porównujemy z poziomem istotności α:
W pewnym doświadczeniu bierze udział 150 osób wybranych w sposób losowy z populacji pracowników 3 różnych firm przewozowych. Z każdej firmy do próby wybrano 50 osób. Przed przystąpieniem do eksperymentu należy sprawdzić czy średni wiek pracowników tych firm jest podobny, od tego bowiem zależeć będzie kolejny etap eksperymentu. Wiek każdego uczestnika eksperymentu zapisano w latach.
Wiek (przewoźnik 1): 27, 33, 25, 32, 34, 38, 31, 34, 20, 30, 30, 27, 34, 32, 33, 25, 40, 35, 29, 20, 18, 28, 26, 22, 24, 24, 25, 28, 32, 32, 33, 32, 34, 27, 34, 27, 35, 28, 35, 34, 28, 29, 38, 26, 36, 31, 25, 35, 41, 37;
Wiek (przewoźnik 2): 38, 34, 33, 27, 36, 20, 37, 40, 27, 26, 40, 44, 36, 32, 26, 34, 27, 31, 36, 36, 25, 40, 27, 30, 36, 29, 32, 41, 49, 24, 36, 38, 18, 33, 30, 28, 27, 26, 42, 34, 24, 32, 36, 30, 37, 34, 33, 30, 44, 29;
Wiek (przewoźnik 3): 34, 36, 31, 37, 45, 39, 36, 34, 39, 27, 35, 33, 36, 28, 38, 25, 29, 26, 45, 28, 27, 32, 33, 30, 39, 40, 36, 33, 28, 32, 36, 39, 32, 39, 37, 35, 44, 34, 21, 42, 40, 32, 30, 23, 32, 34, 27, 39, 37, 35.
Hipotezy:
H0 : średnia wieku dla pracowników wszystkich badanych firm przewozowych jest taka sama,
H1 : przynajmniej 2 średnie są różne.
Porównując wartość p = 0.005147 jednoczynnikowej analizy wariancji z poziomem istotności α = 0.05 stwierdzamy, że średni wiek pracowników tych firm przewozowych jest różny. Na podstawie wyniku samej ANOVA nie możemy odpowiedzieć sobie na pytanie, które grupy różnią się pod względem wieku. By uzyskać taką wiedzę wykorzystany zostanie jeden z testów POST-HOC, np. test Tukeya. W tym celu wznawiamy analizę przyciskiem i w oknie opcji testu wybieramy Tukey HSD.
Najmniejsza istotna różnica (NIR) wyznaczona dla każdej pary porównań jest taka sama (ponieważ liczności grup są sobie równe) i wynosi 2.730855. Porównanie wartości NIR z wartością różnicy średnich wskazuje, że istotne różnice występują tylko pomiędzy wartością średnią dla wieku pracowników pierwszej i trzeciej firmy przewozowej (tylko w przypadku porównania tych dwóch grup wartość NIR jest mniejsza od różnicy średnich).
Ten sam wniosek wyciągniemy porównując wartości p testu POST-HOC z poziomem istotności α = 0.05. Pracownicy pierwszej firmy są młodsi średnio o nieco ponad 3 lata od pracowników trzeciej firmy.
Uwaga! Warunki stawiane jednoczynnikowej analizie wariancji są spełnione:
- rozkład wieku w kadżej z analizowanych firm przewozowych jest rozkładem normalnym (wartość p testu Lillieforsa wynosi odpowiednio p = 0.134516, p = 0.603209,
p = 0.607648),
- test Browna-Forsythea wskazuje na brak istotnych różnic w wariancjach wieku pracowników firm przewozowych (p = 0.430173).