Współczynnik kontyngencji Q-Yulea (Yule (1900)), jest miarą zależności, która może być wyznaczana dla tabel kontyngencji 2 × 2.
gdzie O11, O12, O21, O22 - liczności obserwowane w tabeli kontyngencji.
Wartość współczynnika Q mieści się w przedziale <-1, 1>. Im wartość ta jest bliższa 0, tym siła związku pomiędzy badanymi cechami jest mniejsza, a im bliższa –1 lub +1,
tym siła badanego związku jest większa. Wadą tego współczynnika jest to, iż jest mało odporny na małe liczności obserwowane (gdy jakaś z liczności obserwowanych wynosi 0,
to współczynnik może błędnie wskazywać całkowitą zależność cech).
Istotność statystyczną wyznaczonego współczynnika kontyngencji Q-Yulea określamy testem Z.
Hipotezy:
:
Q = 0,
:
Q ≠ 0.
Współczynnik kontyngencji φ
Współczynnik kontyngencji φ jest miarą zależności wyznaczaną dla tabel kontyngencji 2 × 2.
Wartość współczynnika φ mieści się w przedziale <-1, 1>. Im wartość ta jest bliższa 0,
tym siła związku pomiędzy badanymi cechami jest mniejsza, a im bliższa wartości 1 tym większa.
Współczynnik kontyngencji φ uznaje się za istotny statystycznie jeśli wartość p wyznaczona na podstawie statystyki testu χ2 i rozkładu χ2 (wyznaczonego dla tej tabeli) jest równa bądź mniejsza niż poziom istotności α.
Współczynnik kontyngencji V -Cramera
Współczynnik kontyngencji V -Cramera (Cramer (1946)), jest rozszerzeniem współczynnika φ na tabele kontyngencji r × c.
gdzie χ2 - wartość statystyki testu χ2, n - całkowita liczność w tabeli kontyngencji, w – jest mniejszą z dwóch wartości r i c.
Wartość współczynnika V mieści się w przedziale < 0; 1 >. Im wartość ta jest bliższa 0, tym siła związku pomiędzy badanymi cechami jest mniejsza, a im bliższa +1, tym siła
badanego związku jest większa. Wartość współczynnika V zależy również od wielkości tabeli, stąd nie powinno się stosować tego współczynnika do porównywania tabel kontyngencji o różnych wielkościach.
Współczynnik kontyngencji V uznaje się za istotny statystycznie jeśli wartość p wyznaczona na podstawie statystyki testu χ2 i rozkładu χ2 (wyznaczonego dla tej tabeli) jest równa bądź mniejsza niż poziom istotności α.
Współczynnik kontyngencji C-Pearsona
Współczynnik kontyngencji C-Pearsona jest miarą zależności wyznaczaną dla tabel kontyngencji r × c.
gdzie χ2 - wartość statystyki testu χ2, n - całkowita liczność w tabeli kontyngencji.
Wartość współczynnika C mieści się w przedziale < 0; 1). Im wartość ta jest bliższa 0, tym siła związku pomiędzy badanymi cechami jest mniejsza, a im dalsza od 0, tym
siła badanego związku jest większa. Ponieważ wartość współczynnika C zależy również od wielkości tabeli (im większa tabela, tym wartość C może być bliższa 1), dlatego wyznacza
się górną granicę, jaką dla danej wielkości tabeli współczynnik C może osiągnąć, oraz wyznacza się poprawiony współczynnik C.
Współczynnik kontyngencji C uznaje się za istotny statystycznie jeśli wartość p wyznaczona na podstawie statystyki testu χ2 i rozkładu χ2 (wyznaczonego dla tej tabeli) jest równa bądź mniejsza niż poziom istotności α.
Rozpatrzmy próbę składającą się z 170 osób (n = 170), dla których badamy 2 cechy (X=płeć, Y =zdawalność egzaminu). Każda z tych cech występuje w dwóch kategoriach (X1=k, X2=m, Y1=tak, Y2=nie). Na podstawie tej próby chcielibyśmy się dowiedzieć, czy w badanej populacji istnieje zależność pomiędzy płcią a zdawalnością egzaminu. Rozkład danych przedstawia tabeli kontyngencji:
Wartość statystyki testowej testu chi-kwadrat wynosi 16.33 a wyznaczona dla niej wartość p = 0.00005. Uzyskany wynik wskazuje na istnienie zależności statystycznej pomiędzy płcią a zdawalnością egzaminu w badanej populacji. Wartość współczynników opartych o test chi-kwadrat, a zatem siła związku między badanymi cechami to:
Współczynnik kontyngencji Cadj-Pearsona = 0.42,
Współczynnik kontyngencji V-Cramera = φ = 0.31,
Współczynnik kontyngencji Q-Yulea = 0.58, a wartość p wykonanego testu Z podobnie jak poziom istotności testu chi-kwadrat wskazuje na istotność statystyczną badanego związku.