PQStat - Statystyczne Oprogramowanie Obliczeniowe

PQStat

Statystyczne Oprogramowanie Obliczeniowe

Polski English

O Programie

Kup teraz

Baza wiedzy

Kontakt

Współczynniki tabel kontyngencji i ich istotność statystyczna

Współczynniki kontyngencji (Q-Yulea, Phi, C-Pearsona, V-Cramera) są wyliczane dla danych w postaci surowej lub danych zebranych w tabelę kontyngencji.

Polecenie:

Statystyka

Testy nieparametryczne (kat. nieuporządkowane)

Q-Yule, Phi (2x2)

C-Pearsona, V-Cramera (RxC)

okno_pearson_cramer

Współczynnik kontyngencji Q-Yulea

Współczynnik kontyngencji Q-Yulea (Yule (1900)), jest miarą zależności, która może być wyznaczana dla tabel kontyngencji 2 × 2.
wsp_q_yule
gdzie O₁₁, O₁₂, O₂₁, O₂₂ - liczności obserwowane w tabeli kontyngencji.

Wartość współczynnika Q mieści się w przedziale <-1, 1>. Im wartość ta jest bliższa 0, tym siła związku pomiędzy badanymi cechami jest mniejsza, a im bliższa –1 lub +1, tym siła badanego związku jest większa. Wadą tego współczynnika jest to, iż jest mało odporny na małe liczności obserwowane (gdy jakaś z liczności obserwowanych wynosi 0, to współczynnik może błędnie wskazywać całkowitą zależność cech).

Istotność statystyczną wyznaczonego współczynnika kontyngencji Q-Yulea określamy testem Z.
Hipotezy:

: Q = 0,
: Q ≠ 0.

Współczynnik kontyngencji φ

Współczynnik kontyngencji φ jest miarą zależności wyznaczaną dla tabel kontyngencji 2 × 2.
wsp_phi
Wartość współczynnika φ mieści się w przedziale <-1, 1>. Im wartość ta jest bliższa 0, tym siła związku pomiędzy badanymi cechami jest mniejsza, a im bliższa wartości 1 tym większa.

Współczynnik kontyngencji φ uznaje się za istotny statystycznie jeśli wartość p wyznaczona na podstawie statystyki testu χ² i rozkładu χ² (wyznaczonego dla tej tabeli) jest równa bądź mniejsza niż poziom istotności α.

yule_phi

Współczynnik kontyngencji V -Cramera

Współczynnik kontyngencji V -Cramera (Cramer (1946)), jest rozszerzeniem współczynnika φ na tabele kontyngencji r × c.
wsp_v_cramera
gdzie χ² - wartość statystyki testu χ²,
n - całkowita liczność w tabeli kontyngencji,
w – jest mniejszą z dwóch wartości r i c.

Wartość współczynnika V mieści się w przedziale < 0; 1 >. Im wartość ta jest bliższa 0, tym siła związku pomiędzy badanymi cechami jest mniejsza, a im bliższa +1, tym siła badanego związku jest większa. Wartość współczynnika V zależy również od wielkości tabeli, stąd nie powinno się stosować tego współczynnika do porównywania tabel kontyngencji o różnych wielkościach.

Współczynnik kontyngencji V uznaje się za istotny statystycznie jeśli wartość p wyznaczona na podstawie statystyki testu χ² i rozkładu χ² (wyznaczonego dla tej tabeli) jest równa bądź mniejsza niż poziom istotności α.

Współczynnik kontyngencji C-Pearsona

Współczynnik kontyngencji C-Pearsona jest miarą zależności wyznaczaną dla tabel kontyngencji r × c.
wsp_C_pearsona
gdzie χ² - wartość statystyki testu χ²,
n - całkowita liczność w tabeli kontyngencji.

Wartość współczynnika C mieści się w przedziale < 0; 1). Im wartość ta jest bliższa 0, tym siła związku pomiędzy badanymi cechami jest mniejsza, a im dalsza od 0, tym siła badanego związku jest większa. Ponieważ wartość współczynnika C zależy również od wielkości tabeli (im większa tabela, tym wartość C może być bliższa 1), dlatego wyznacza się górną granicę, jaką dla danej wielkości tabeli współczynnik C może osiągnąć, oraz wyznacza się poprawiony współczynnik C.

Współczynnik kontyngencji C uznaje się za istotny statystycznie jeśli wartość p wyznaczona na podstawie statystyki testu χ² i rozkładu χ² (wyznaczonego dla tej tabeli) jest równa bądź mniejsza niż poziom istotności α.

Przykład (plik PL_płeć-egzamin.pqs) -> Zobacz film

Rozpatrzmy próbę składającą się z 170 osób (n = 170), dla których badamy 2 cechy (X=płeć, Y =zdawalność egzaminu). Każda z tych cech występuje w dwóch kategoriach (X1=k, X2=m, Y1=tak, Y2=nie). Na podstawie tej próby chcielibyśmy się dowiedzieć, czy w badanej populacji istnieje zależność pomiędzy płcią a zdawalnością egzaminu. Rozkład danych przedstawia tabeli kontyngencji:

dane_ch_kw_maly

raport_yule_phi

raport_pearson_cramer

wykres_fisher_2_2

Wartość statystyki testowej testu chi-kwadrat wynosi 16.33 a wyznaczona dla niej wartość p = 0.00005. Uzyskany wynik wskazuje na istnienie zależności statystycznej pomiędzy płcią a zdawalnością egzaminu w badanej populacji. Wartość współczynników opartych o test chi-kwadrat, a zatem siła związku między badanymi cechami to:
Współczynnik kontyngencji C_adj-Pearsona = 0.42,
Współczynnik kontyngencji V-Cramera = φ = 0.31,
Współczynnik kontyngencji Q-Yulea = 0.58, a wartość p wykonanego testu Z podobnie jak poziom istotności testu chi-kwadrat wskazuje na istotność statystyczną badanego związku.

FAQ | Polityka prywatności | Kontakt