Współczynnik korelacji wewnątrzklasowej stosuje się w sytuacji, gdy pomiarów badanej zmiennej dokonuje kilku ”sędziów” (k>=2). Mierzy on siłę sędziowskiej rzetelności, czyli stopień w jakim ich oceny są zgodne. Można go wyznaczać w modelu zależnym, dla skali interwałowej, o ile rozkład badanej zmiennej jest rozkładem normalnym.
gdzie:
MSBC – średnia kwadratów między pomiarami (między sędziami),
MSBS – średnia kwadratów między obiektami,
MSres – średnia kwadratów dla reszt,
n – liczność próby, k – ilość sędziów.
Uwaga!RICC oznacza współczynnik korelacji wewnątrzklasowej w populacji, natomiast rICC w próbie.
Wartość rICC∈<-1; 1> interpretujemy w następujący sposób: rICC ≈ 1 oznacza silną bezwzględną zgodność w ocenie poszczególnych obiektów przez sędziów, co ma odzwierciedlenie w dużej wariancji między obiektami (znacznej różnicy średnich między n obiektami) i małej wariancji między ocenami sędziowskimi (niewielkiej różnicy średnich ocen wyznaczonych dla k sędziów); rICC≈ -1 negatywny współczynnik korelacji wewnątrzklasowej, jest traktowany w ten sam sposób jak rICC ≈ 0; rICC≈ 0 oznacza brak bezwzględnej zgodności w ocenie poszczególnych obiektów przez sędziów, co ma odzwierciedlenie w małej wariancji między obiektami (niewielkiej różnicy średnich między n obiektami) i dużej wariancji między ocenami sędziowskimi (znaczącej różnicy średnich ocen wyznaczonych dla k sędziów).
Test F do sprawdzania istotności współczynnika korelacji wewnątrzklasowej
Podstawowe warunki stosowania:
pomiar na skali interwałowej,
normalność rozkładu badanej cechy.
Hipotezy:
:
RICC = 0,
:
RICC ≠ 0 (RICC = 1).
Wyznaczoną na podstawie statystyki testowej wartość p porównujemy z poziomem istotności α:
Badano zgodność pomiarów natężenia dźwięku dokonanych przez 3 różne mierniki. Pomiarów dokonano w 12 punktach pomiarowych.
Hipotezy:
H0 : brak bezwzględnej zgodności pomiędzy poziomem natężenia dźwięku, badanym przy pomocy 3 różnych mierników, w populacji reprezentowanej przez zebraną próbę,
H1 : poziom natężenia dźwięku, mierzony w populacji reprezentowanej przez zebraną próbę, jest bezwzględnie zgodny dla 3 różnych mierników natężenia użytych
w tym badaniu.
Porównując wartość p < 0.000001 z poziomem istotności α = 0.05, stwierdziliśmy, że poziom natężenia dźwięku mierzony przy pomocy 3 różnych mierników natężenia w badanej populacji jest bezwzględnie zgodny. Siła bezwzględnej zgodności jest wysoka i wynosi rICC = 0.92029.
Zgodność uzyskanych wyników obserwujemy również na wykresach Blanda-Altmana, gdzie prawie wszystkie wartości wpadają do wyznaczonego przedziału: