Statystyka Testy nieparametryczne (kat. nieuporządkowane) Z dla proporcji
Testy dla jednej proporcji stosujemy, gdy mamy do uzyskania dwa możliwe wyniki (jeden z nich to
wynik wyróżniony o liczności m) i wiemy jak często te wyniki pojawiają sie w próbie (znamy proporcję p).
W zależności od wielkości próby n mamy do wyboru test Z dla jednej proporcji – dla dużych prób
oraz test dwumianowy – dla prób o małej liczności. Testy te służą do weryfikacji hipotezy, że proporcja
w populacji z której pochodzi próba to zadana wartość.
Podstawowe warunki stosowania:
pomiar na skali nominalnej (porządkowej, interwałowej).
Dodatkowy warunek dla testu Z dla jednej proporcji:
Wyznaczoną na podstawie statystyki testowej wartość p porównujemy z poziomem istotności α:
jeżeli p ≤α ⇒ odrzucamy H0 przyjmując H1,
jeżeli p >α ⇒ nie ma podstaw odrzucić H0.
Uwaga
Dla estymatora z próby jakim jest w tym przypadku wartość proporcji p wyznacza się przedział ufności. Dla prób o dużej liczności można bazować na przedziałach opartych o rozkład normalny - tzw. przedziały
Walda. Bardziej uniwersalne są natomiast przedziały zaproponowane przez Wilsona (1927)a także Agresti i Coull (1998). Przedziały Cloppera i Pearsona (1934) są dokładniejsze dla prób o mniejszej liczności.
Porównanie metod budowania przedziałów dla proporcji można znaleźć w pracy Brown L.D i innych (2001).
Załóżmy, że chcielibyśmy sprawdzić, czy w piątek wydawana jest 1/5 spośród wszystkich obiadów wydawanych w szkolnej stołówce w ciągu tygodnia. Dla pobranej próby m = 20, n = 150.
Przy ustawianiu opcji analizy włączamy filtr wybierając odpowiedni dzień tygodnia - czyli piątek. Brak ustawienia filtru nie generuje błędu a jedynie wyliczenie kolejnych statystyk dla kolejnych dni tygodnia.
Hipotezy:
H0 : w piątek, w stołówce szkolnej wydaje się 1/5 spośród obiadów wydawanych w ciągu tygodnia w tej stołówce,
H1 : w piatek, w stołówce szkolnej wydaje się istotnie więcej lub mniej niż 1/5 spośród obiadów wydawanych w ciągu tygodnia w tej stołówce.
Proporcja wartości wyróżnionych w próbie to p = m/n = 0.133 a 95% przedział ufności Cloppera-Pearsona dla tej frakcji (0.083, 0.198) nie zawiera hipotetycznej wartości 0.2. Na podstawie testu Z bez poprawki na ciągłość (p=0.041227) jak i na podstawie dokładnej wartości prawdopodobieństwa wyliczonego z rozkładu dwumianowego (p=0.044711) moglibyśmy przyjąć (na poziomie istotności α = 0.05), że w piątek wydaje się statystycznie mniej niż 1/5 obiadów wydawanych przez cały tydzień. Po zastosowaniu poprawki na ciągłość jednak nie udaje się odrzucić hipotezy zerowej (p=0.052479).