Statystyka Modele wielowymiarowe Regresja PH Cox’a - porównywanie modeli
Ze względu na możliwość jednoczesnej analizy wielu zmiennych niezależnych w jednym modelu regresji Cox'a, istnieje problem wyboru optymalnego modelu. Wybierając zmienne niezależne należy pamiętać, by w modelu znajdowały się zmienne silnie związane z czasem przeżycia i słabo skorelowane między sobą.
Porównując modele z różną liczbą zmiennych niezależnych zwracamy uwagę na kryteria informacyjne (AIC, AICc, BIC) oraz dopasowanie modelu (R2Pseudo, R2Nagelkerke lub R2Cox-Snell). Modele porównywane są również przy użyciu testu ilorazu wiarygodności.
Hipotezy:
:
LFM = LRM,
:
LFM ≠ LRM.
gdzie:
LFM,LRM - maksimum funkcji wiarygodności w porównywanych modelach (pełnym i zredukowanym).
Wyznaczoną na podstawie statystyki testowej wartość p porównujemy z poziomem istotności α
jeżeli p ≤α ⇒ odrzucamy H0 przyjmując H1,
jeżeli p >α ⇒ nie ma podstaw odrzucić H0.
Decyzję o tym, który model wybrać podejmujemy na podstawie wielkości AIC, AICc, BIC,R2Pseudo, R2Nagelkerke lub R2Cox-Snell oraz wyniku testu ilorazu wiarygodności porównującego kolejno powstające (sąsiednie) modele. Jeśli porównywane modele nie różnią się istotnie, to powinniśmy wybrać ten z mniejszą liczbą zmiennych. Brak różnicy oznacza bowiem, że zmienne które są w modelu pełnym, a nie ma ich w modelu zredukowanym,
nie wnoszą istotnej informacji. Jeśli natomiast różnica jest istotna statystycznie oznacza to, że jeden z nich (ten z większą liczbą zmiennych, o większym R2) jest istotnie lepszy niż drugi.
W programie PQStat porównywanie modeli możemy przeprowadzić ręcznie lub automatycznie.
Ręczne porównywanie modeli – polega na zbudowaniu 2 modeli:
pełnego – modelu z większą liczbą zmiennych,
zredukowanego – modelu z mniejszą liczbą zmiennych – model taki powstaje z modelu pełnego po usunięciu zmiennych, które z punktu widzenia badanego zjawiska są zbędne.
Wybór zmiennych niezależnych w porównywanych modelach a następnie wybór lepszego modelu, na podstawie uzyskanych wyników porównania, należy do badacza.
Automatyczne porównywanie modeli jest wykonywane w kilku krokach:
krok 1 - Zbudowanie modelu z wszystkich zmiennych.
krok 2 - Usunięcie jednej zmiennej z modelu. Usuwana zmienna to ta, która ze statystycznego punktu widzenia wnosi do aktualnego modelu najmniej informacji.
krok 3 - Porównanie modelu pełnego i zredukowanego.
krok 4 - Usunięcie kolejnej zmiennej z modelu. Usuwana zmienna to ta, która ze statystycznego punktu widzenia wnosi do aktualnego modelu najmniej informacji.
krok 5 - Porównanie modelu wcześniejszego i nowo zredukowanego.
...
W ten sposób powstaje wiele, coraz mniejszych modeli. Ostatni model zawiera tylko 1 zmienną niezależną.