Test χ2 dobroci dopasowania nazywany jest również testem χ2
dla pojedynczej próby, przeznaczony jest do testowania zgodności wartości obserwowanych dla k (k >=2)
kategorii X1,X2, ...,Xk jednej cechy X z hipotetycznymi wartościami oczekiwanymi dla tej cechy.
Wartości wszystkich n pomiarów należy zebrać w postaci tabeli składającej się z k wierszy (kategorii:
X1,X2, ...,Xk).
Dla każdej kategorii Xi zapisuje się częstość jej występowania Oi oraz częstość dla niej
oczekiwaną Ei lub prawdopodobieństwo jej wystapienia pi. Częstość oczekiwana jest wyznaczana jako
iloczyn Ei = npi i suma wszystkich częstości oczekiwanych i częstości obserwowanych jest taka sama,
a suma wszystkich prawdopodobieństw pi wynosi 1. Utworzona tabela może przyjąć jedną z poniższych
postaci:
Podstawowe warunki stosowania:
pomiar na skali nominalnej (porządkowej lub interwałowej),
duże liczności oczekiwane (według interpretacji Cochrana (1952) żadna z liczności oczekiwanych nie
może być < 1 oraz nie więcej niż 20% liczności oczekiwanych może być < 5).
Hipotezy:
:
Οi = Ei dla wszystkich kategorii,
:
Οi ≠ Ei dla przynajmniej jednej kategorii.
Wyznaczoną na podstawie statystyki testowej wartość p porównujemy z poziomem istotności α:
Chcielibyśmy sie dowiedzieć, czy liczba wydawanych obiadów w kolejnych dniach tygodnia (od poniedziałku do piątku) w pewnej szkolnej stołówce jest statystycznie taka sama. W tym celu pobrano tygodniową próbę i zapisano dla niej ilość wydanych obiadów w poszczególnych dniach: poniedziałek - 33, wtorek - 29, środa - 32, czwartek - 36, piątek - 20. Łącznie przez cały tydzień (5 dni) wydano 150 obiadów.
Zakładamy, że w każdy dzień prawdopodobieństwo wydania obiadu jest takie samo, czyli wynosi 1/5 . Oczekiwana liczba wydanych obiadów dla każdego z pięciu dni tygodnia wynosi więc Ei = 150*1/5 = 30.
Postawiono hipotezy:
H0 : liczba wydawanych obiadów w badanej stołówce szkolnej w kolejnych dniach tygodnia jest zgodna z oczekiwaną ilością wydawanych obiadów w tych dniach,
H1 : liczba wydawanych obiadów w badanej stołówce szkolnej w kolejnych dniach tygodnia nie jest zgodna z oczekiwaną ilością wydawanych obiadów w tych dniach.
Wartość p z rozkładu chi-kwadrat dla 4 stopni swobody wynosi 0.287297. Zatem na poziomie istotności α = 0.05 możemy powiedzieć, że nie mamy podstaw, aby odrzucić hipotezę zerową mówiącą o zgodności liczby wydawanych obiadów z oczekiwaną liczbą wydawanych obiadów w poszczególnych dniach.
Uwaga!
Gdybyśmy chcieli w ramach jednego badania dokonać większej liczby porównań, moglibyśmy zastosować poprawkę Bonferroniego Abdi H. (2007). Ta poprawka jest używana by ograniczyć wielkość popełnionego błędu pierwszego rodzaju, gdy porównujemy wartości obserwowane i oczekiwane pomiędzy wybranymi dniami np:
Pt i Pn,
Pt i Wt,
Pt i Śr,
Pt i Czw,
przy założeniu, że porównania wykonujemy niezależnie. Poziom istotności α dla każdego porównania wyznaczamy zgodnie z tą poprawką według wzoru: α = 0.05/k, gdzie k to liczba wykonywanych porównań. Poziom istotności dla pojedynczego porównania zgodnie z poprawką Bonferroniego wynosi dla naszego przykładu α = 0.05/4 = 0.0125.
Należy jednak pamiętać, że redukując alfa dla każdego porównania zmniejszamy również moc testu.