Współczynnik korelacji liniowej Pearsonarp (Pearson (1896,1900)) jest wykorzystywany do badania siły związku liniowego pomiędzy cechami X i Y. Można go wyznaczać dla skali interwałowej o ile rozkład badanych cech jest rozkładem normalnym.
gdzie xi, yi - kolejne pomiary cechy X i Y, - średnia cechy X i cechy Y, n - liczebność próby.
Uwaga!Rp oznacza współczynnik korelacji Pearsona w populacji, rp w próbie.
Wartość rp∈< -1; 1 > interpretujemy w następujący sposób:
rp ≈ 1 oznacza silną dodatnią zależność liniową, tj. punkty pomiarowe leżą blisko linii prostej a wzrostowi zmiennej niezależnej odpowiada wzrost zmiennej zależnej;
rp ≈ -1 oznacza silną ujemną zależność liniową, tj. punkty pomiarowe leżą blisko linii prostej, lecz wzrostowi zmiennej niezależnej odpowiada spadek zmiennej zależnej;
gdy współczynnik korelacji liniowej przyjmuje wartość równą lub bardzo bliską zeru wówczas nie istnieje liniowa zależność między badanymi parametrami (ale może istnieć związek nieliniowy).
Tworzony model korelacji przedstawia zależność liniową postaci y = βx + α. Współczynniki β i α
równania regresji liniowej możemy wyznaczyć z wzorów:
Test t do sprawdzania istotności współczynnika korelacji liniowej Pearsona rp
Test do sprawdzania istotności współczynnika korelacji liniowej Pearsona służy do weryfikacji hipotezy o braku zależności liniowej
pomiędzy badanymi cechami populacji i opiera się na współczynniku korelacji liniowej Pearsona wyliczonym dla próby.
Im wartość rp będzie bliższa 0, tym słabszą zależnością związane są badane cechy.
Podstawowe warunki stosowania:
pomiar na skali interwałowej,
normalność rozkładu badanych cech.
Hipotezy:
gdzie Rp jest współczynnikiem korelacji liniowej Pearsona wyznaczonym dla populacji.
Test t do sprawdzania istotności współczynników równania regresji liniowej
Służy do weryfikacji hipotezy o braku zależności liniowej pomiędzy badanymi cechami populacji i opiera
się na współczynniku nachylenia prostej wyliczonym dla próby. Im wartość β będzie bliższa 0, tym słabszą
zależność dopsaowana prosta przedstawia.
Podstawowe warunki stosowania:
pomiar na skali interwałowej,
normalność rozkładu badanych cech.
Hipotezy:
:
β = O,
:
β ≠ O.
Wyznaczoną na podstawie statystyki testowej wartość p porównujemy z poziomem istotności α:
Wśród uczniów pewnej szkoły baletowej badano zależność pomiędzy wiekiem a wzrostem. Wtym celu pobrano próbę obejmującą szesnaścioro dzieci i zapisano dla nich następujące wyniki pomiaru tych cech:
(wiek, wzrost): (5, 128) (5, 129) (5, 135) (6, 132) (6, 137) (6, 140) (7, 148) (7, 150) (8, 135) (8, 142) (8, 151) (9, 138) (9, 153) (10, 159) (10, 160) (10, 162).
Hipotezy:
H0 : nie istnieje zależność liniowa pomiędzy wiekiem a wzrostem dla populacji dzieci badanej szkoły,
H1 : istnieje zależność liniowa pomiędzy wiekiem a wzrostem dla populacji dzieci badanej szkoły.
Porównując wartość p=0.000069 z poziomem istotności α = 0.05 stwierdzamy, że istnieje zależność liniowa pomiędzy wiekiem a wzrostem dla populacji dzieci badanej szkoły. Zależność ta jest wprost proporcjonalna, tzn. wraz ze wzrostem wieku dzieci rośnie wysokość ciała. Współczynnik korelacji liniowej Pearsona, a zatem siła związku liniowego pomiędzy wiekiem a wzrostem wynosi r2=0.8302.
Współczynnik determinacji r2p = 0.6892 oznacza, że ok. 69% zmienności wzrostu jest tłumaczona zmiennością wieku.
Z równania regresji postaci:
wzrost = 5.09 · wiek + 105.83
można wyliczyć predykcyjną wartość dla dziecka w wieku np. 6 lat. Przewidywany wzrost takiego dziecka wynosi 136.37cm.