Test χ2 , oraz test Fishera dla tabel 2 × 2 oraz ich poprawki
Test ten jest wyliczany dla tabel kontyngencji 2×2 - tabel dla 2 cech (X, Y ), z których każda ma możliwe dwie kategorie (patrz : tabele kontyngencji). Dla tabel takich oprócz testów statystycznych wyliczany jest iloraz szans (ang. Odds Ratio - OR) jak i relatywne ryzyko (ang. Relative Risk - RR) wraz z przedziałami ufności.
Podstawowe warunki stosowania:
pomiar na skali nominalnej (porządkowej lub interwałowej),
model niezależny.
Dodatkowy warunek dla testu χ2 :
duże liczności oczekiwane (według interpretacji Cochrana (1952) żadna z liczności oczekiwanych nie
może być < 1 oraz nie więcej niż 20% liczności oczekiwanych może być < 5).
Hipotezy w brzmieniu ogólnym:
:
Oij = Eij dla wszystkich kategorii,
:
Oij ≠ Eij dla przynajmniej jednej kategorii.
Hipotezy w brzmieniu testu niezależności:
:
nie istnieje zależność pomiędzy badanymi cechami populacji
(obie klasyfikacje ze względu na cechę X i na cechę Y są statystycznie niezależne),
:
istnieje zależność pomiędzy badanymi cechami populacji.
Hipotezy w brzmieniu testu heterogeniczności:
:
w badanej populacji rozkład kategorii cechy X jest taki sam dla obu kategorii cechy Y,
:
w badanej populacji rozkład kategorii cechy X jest inny dla obu kategorii cechy Y.
Test χ2 dla tabel 2 × 2 (Karl Pearson 1900) jest zawężeniem
testu χ2 dla tabel R × C
Test χ2 z poprawką Yatesa na ciągłość
Test χ2 z poprawką Yatesa (Frank Yates (1934)) jest testem bardziej konserwatywny od testu χ2 (trudniej niż test χ2 odrzuca hipotezę zerową). Poprawka
na ciągłość ma zapewnić możliwość przyjmowania przez statystykę testową wszystkich wartości liczb
rzeczywistych zgodnie z założeniem rozkładu χ2.
Wyznaczoną na podstawie statystyki testowej wartość p porównujemy z poziomem istotności α:
Rozpatrzmy próbę składającą się z 170 osób (n = 170), dla których badamy 2 cechy (X=płeć, Y =zdawalność egzaminu). Każda z tych cech występuje w dwóch kategoriach (X1=k, X2=m, Y1=tak, Y2=nie). Na podstawie tej próby chcielibyśmy się dowiedzieć, czy w badanej populacji istnieje zależność pomiędzy płcią a zdawalnością egzaminu. Rozkład danych przedstawia tabeli kontyngencji:
Hipotezy:
H0 : nie istnieje zależność pomiędzy płcią a zdawalnością egzaminu w badanej populacji,
H1 : istnieje zależność pomiędzy płcią a zdawalnością egzaminu w badanej populacji.
Tabela liczności oczekiwanych nie zawiera wartości mniejszych niż 5. Wartość p = 0.000053. Zatem na poziomie istotności α = 0.05 przyjmujemy hipotezę alternatywną mówiącą o występowaniu zależności pomiędzy płcią a zdawalnością egzaminu w badanej populacji. Istotnie częściej ten egzamin zdają kobiety (50/90 = 55.56% z wszystkich kobiet w próbie zdało egzamin) niż mężczyźni (20/80 = 25.00% z wszystkich mężczyzn w próbie zdało egzamin).
Test dokładny Fishera (R. A. Fisher (1934, 1935)) określa dokładne prawdopodobieństwo wystąpienia konkretnego rozkładu liczb w tabeli przy znanym n i ustalonych licznościach
brzegowych.
Test mid-p
Test ten jest korektą testu dokładnego Fishera. Ta zmodyfikowana wartość poziomu istotności jest rekomendowana przez wielu statystyków (Lancaster 1961, Anscombe 1981, Pratt and Gibbons 1981, Plackett
1984, Miettinen 1985 and Barnard 1989) jako metoda zmniejszenia konserwatyzmu testu dokładnego Fishera. W rezultacie testem mid-p szybciej odrzucimy hipotezę zerowa niż dokładnym testem Fishera.
Wyznaczoną wartość p porównujemy z poziomem istotności α:
Hipotezy:
H0 : nie istnieje zależność pomiędzy płcią a zdawalnością egzaminu w badanej populacji,
H1 : istnieje zależność pomiędzy płcią a zdawalnością egzaminu w badanej populacji.
Dwustronna wartość p testu dokładnego Fishera wynosi 0.000083, a mid-p 0.000054. Zatem podobnie jak dla testu χ2 i χ2 z poprawką Yatesa, na poziomie istotności α = 0.05 przyjmujemy hipotezę alternatywną mówiącą o występowaniu zależności pomiędzy płcią a zdawalnością egzaminu w badanej populacji. Istotnie częściej ten egzamin zdają kobiety (50/90 = 55.56% z wszystkich kobiet w próbie zdało egzamin) niż mężczyźni (20/80 = 25.00% z wszystkich mężczyzn w pr??bie zdało egzamin).