Statystyka Testy nieparametryczne (kat. uporządkowane) W Kendalla
Współczynnik zgodności Kendalla opisany w pracy Kendalla i Babingtona-Smitha (1939) oraz Wallisa (1939) stosuje się w sytuacji, gdy dysponujemy rankingami pochodzącymi z różnych źródeł (od różnych sędziów) i dotyczącymi kilku (k>=2) obiektów a zależy nam na ocenie zgodności tych rankingów. Często używa się go do mierzenia siły sędziowskiej rzetelności, czyli stopnia w jakim oceny sędziów są zgodne.
Współczynnik zgodności Kendalla wyznacza się dla skali porządkowej lub interwałowej, a jego wartość wylicza się według wzoru:
gdzie:
n - liczba różnych zbiorów ocen (ilość sędziów), k - ilość rangowanych obiektów,
,
Rij - rangi przypisane kolejnym obiekom (j = 1, 2, ...k), oddzielnie dla każdego z sędziów (i = 1, 2, ...n),
- korekta na rangi wiązane,
t – liczba przypadków wchodzących w skład rangi wiązanej.
Uwaga!
Równoważnie współczynnik ten można wyznaczać w oparciu o statystykę chi-kwadrat Friedmana.
Uwaga!
W – oznacza współczynnik zgodności Kendalla w populacji, w próbie.
Wartość ∈<0; 1> interpretujemy w następujący sposób: ≈ 1 oznacza silną zgodność w ocenie poszczególnych obiektów przez sędziów; ≈ 0 oznacza brak zgodności w ocenie poszczególnych obiektów przez sędziów.
Test chi-kwadrat do sprawdzania istotności współczynnika zgodności Kendalla
Podstawowe warunki stosowania:
pomiar na skali porządkowej lub interwałowej.
Hipotezy:
:
W = 0,
:
W ≠ 0.
Wyznaczoną na podstawie statystyki testowej wartość p porównujemy z poziomem istotności α:
W systemie szóstkowym oceny par tanecznych 9 sędziów punktuje m.in. wrażenie artystyczne. Sędziowie rozpoczynają wystawianie oceny od porównania zawodników względem siebie i ustawienia ich na określonym miejscu (tworzą ich ranking). Sprawdzimy, czy rangi przypisane przez sędziów są zgodne:
Hipotezy:
H0 : brak zgodności pomiędzy rankingami 9 sędziów w populacji reprezentowanej przez zebraną próbę,
H1 : rankingami 9 sędziów w populacji reprezentowanej przez zebraną próbę są zgodne.
Porównując wartość p < 0.000001 z poziomem istotności α = 0.05, stwierdziliśmy, że oceny sędziów są statystycznie zgodne. Siła tej zgodności jest wysoka i wynosi = 0.83351, podobnie jak średni współczynnik korelacji monotonicznej Spearmana rs = 0.81270. Wynik ten możemy przedstawić na wykresie, na którym oś X reprezentuje kolejnych sędziów. Wówczas im częściej przecinają się linie, (które powinny być równoległe do osi X, gdy zgodność jest pełna), tym słabszą zgodność reprezentują oceny sędziów.