Test χ2 dla tabel R × C oraz test Fishera-Freemana-Haltona
Podstawowe warunki stosowania:
pomiar na skali nominalnej (porządkowej lub interwałowej),
model niezależny.
Dodatkowy warunek dla testu χ2 :
duże liczności oczekiwane (według interpretacji Cochrana (1952) żadna z liczności oczekiwanych nie
może być < 1 oraz nie więcej niż 20% liczności oczekiwanych może być < 5).
Hipotezy w brzmieniu ogólnym:
:
Oij = Eij dla wszystkich kategorii,
:
Oij ≠ Eij dla przynajmniej jednej kategorii.
Hipotezy w brzmieniu testu niezależności:
:
nie istnieje zależność pomiędzy badanymi cechami populacji
(obie klasyfikacje ze względu na cechę X i na cechę Y są statystycznie niezależne),
:
istnieje zależność pomiędzy badanymi cechami populacji.
Hipotezy w brzmieniu testu heterogeniczności::
:
w badanej populacji rozkład kategorii cechy X jest taki sam dla każdej kategorii cechy Y,
:
w badanej populacji rozkład kategorii cechy X jest inny dla przynajmniej jednej kategorii cechy Y.
Test χ2 dla tabel R × C, Karl Pearson 1900. Test ten jest rozszerzeniem
testu χ2 dobroci dopasowania na 2 cechy . Opiera się na danych zebranych w postaci tabeli kontyngencji
2 cech (X, Y ), z których pierwsza ma możliwe r kategorii X1,X2, ...,Xr a druga c kategorii Y1, Y2, ..., Yc
(patrz tabela 2.3).
Wyznaczoną na podstawie statystyki testowej wartość p porównujemy z poziomem istotności α:
Rozpatrujemy próbę 605 osób (n = 605), dla których badamy 2 cechy (X=kraj zamieszkania, Y =wykształcenie). Pierwsza cecha występuje w 4, a druga w 3 kategoriach (X1=Kraj 1, X2=Kraj 2, X3=Kraj 3, X4=Kraj 4, Y1=podstawowe, Y2=średnie, Y3=wyższe). Rozkład danych przedstawia tabela kontyngencji:
Na podstawie tej próby chcielibyśmy się dowiedzieć, czy w badanej populacji istnieje zależność pomiędzy wykształceniem a krajem zamieszkania.
Hipotezy:
H0 : nie istnieje zależność pomiędzy wykształceniem a krajem zamieszkania w badanej populacji,
H1 : istnieje zależność pomiędzy wykształceniem a krajem zamieszkania w badanej populacji.
Tabela liczności oczekiwanych nie zawiera wartości mniejszych niż 5. Wartość p = 0.03174. Zatem na poziomie istotności α = 0.05 możemy powiedzieć, że istniej zależność pomiędzy krajem zamieszkania a wykształceniem w badanej populacji.
Test Fishera-Freemana-Haltona (Freeman G.H., Halton J.H. (1951)) jest rozszerzeniem na tabele R × C testu dokładnego Fishera. Określa dokładne prawdopodobieństwo wystąpienia konkretnego rozkładu liczb w tabeli przy znanym n i ustalonych sumach brzegowych.
Wyznaczoną wartość p porównujemy z poziomem istotności α:
jeżeli p ≤α ⇒ odrzucamy H0 przyjmując H1,
jeżeli p >α ⇒ nie ma podstaw odrzucić H0.
Uwaga! Procedura obliczania wartości p dla tego testu bazuje na algorytmie opublikowanym w pracy Mehta (1986).