Statystyka Testy nieparametryczne (kat. nieuporządkowane) Z dla dwóch niezależnych proporcji
Test ten służy do weryfikacji hipotezy, że wyróżnione proporcje w populacjach z których pochodzą próby są sobie równe.
Podstawowe warunki stosowania:
pomiar na skali nominalnej (porządkowej, interwałowej),
model niezależny,
duża liczność.
Hipotezy:
gdzie:
P1, P2 wyróżniona frakcja dla pierwszej i drugiej populacji.
Wyznaczoną na podstawie statystyki testowej wartość p porównujemy z poziomem istotności α:
jeżeli p ≤α ⇒ odrzucamy H0 przyjmując H1,
jeżeli p >α ⇒ nie ma podstaw odrzucić H0.
W programie oprócz różnicy proporcji wyliczana jest wartość wskaźnika NNT.
NNT (ang. number needed to treat) -- wskaźnik stosowany w medycynie, oznacza liczbę pacjentów, których trzeba poddać leczeniu przez określony czas, aby wyleczyć jedną osobę.
Uwaga!
Przedziały ufności dla różnicy dwóch niezależnych proporcji oraz dla NNT, od wersji PQStat 1.3.0, estymowane są w oparciu o metodę Newcomba-Wilsona.
Wiemy, że 50/90 = 55.56% z wszystkich kobiet w próbie zdaje pozytywnie egzamin i 20/80 = 25.00% z wszystkich mężczyzn w próbie zdaje egzamin pozytywnie. Dane możemy zapisać na dwa sposoby – jako licznik i mianownik dla każdej próby, lub jako proporcja i mianownik dla każdej próby:
Hipotezy:
H0 : proporcja mężczyzn, uzyskujących pozytywny wynik egzaminu jest taka sama jak kobiet uzyskujących pozytywny wynik egzaminu w badanej populacji,
H1 : proporcja mężczyzn, uzyskujących pozytywny wynik egzaminu jest inna niż proporcja kobiet uzyskujących pozytywny wynik egzaminu w badanej populacji.
Uwaga!
Ponieważ w arkuszu danych znajduje się więcej informacji, przed rozpoczęciem analizy należy zaznaczyć odpowiedni obszar (dane bez nagłówków). W oknie testu natomiast wybrać opcję mówiącą o zawartości zmiennej (liczność (licznik) lub proporcja). Różnica proporcji wyróżnionych w próbie to 30.56%, a 95% przedział ufności dla niej (15.90%, 43.35%) nie zawiera 0. Na podstawie testu Z bez poprawki na ciągłość (p=0.000053) jak też z poprawką na ciągłość (p=0.0001), na poziomie istotności α=0.05 przyjmujemy hipotezę alternatywną (podobnie jak w przypadku testu dokładnego Fishera, jego poprawki mid-p, testu χ2 i testu χ2 z poprawką Yatesa). Zatem proporcja mężczyzn, uzyskujących pozytywny wynik egzaminu jest inna niż proporcja kobiet uzyskujących pozytywny wynik egzaminu w badanej populacji. Istotnie częściej ten egzamin zdają kobiety (50/90 = 55.56% z wszystkich kobiet w próbie zdało egzamin) niż mężczyźni (20/80 = 25.00% z wszystkich mężczyzn w próbie zdało egzamin).
Załóżmy, że choroba ma śmiertelność 100% bez leczenia, a terapia zmniejsza śmiertelność do 50% -- jest to wynik 20 letnich badań. Chcemy wiedzieć jak wiele osób będzie trzeba leczyć, aby zapobiec w ciągu 20 lat 1 śmierci. By odpowiedzieć na to pytanie pobrano dwie 100 osobowe próby z populacji osób chorych. W próbie nieleczonych mamy 100 chorych pacjentów, wiemy, że bez leczenia wszyscy oni umrą. W próbie leczonych mamy również 100 pacjentów, z których 50 przeżyje.
Wyliczymy wskaźnik NNT.
Różnica pomiędzy proporcjami jest istotna statystycznie (p<0.000001), ale nas interesuje wskaźnik NNT -- wynosi on 2, czyli stosowanie leczenia u 2 chorych przez 20 lat zapobiegnie 1 śmierci. Wyliczony 95% przedział ufności należy zaokrąglić do wartości całkowitych, co daje NNT od 2 do 3 chorych.