PQStat - Statystyczne Oprogramowanie Obliczeniowe

PQStat

Statystyczne Oprogramowanie Obliczeniowe

Polski English

O Programie

Kup teraz

Baza wiedzy

Kontakt

Statystyka lokalna Getisa i Orda

Polecenie:

Analiza przestrzenna

Statystyki przestrzenne

Statystyka lokalna Gi Getisa i Orda

G_okno_Local_G_Ord

Przykład (katalog: leukemia, plik leukemia.pqs) -> Zobacz film

Analizie poddamy dane dotyczące białaczki.

Mapa leukemia zawiera informacje o lokalizacji 281 wielokątów (regionów spisowych) w północnej części stanu New York.
Dane do mapy leukemia:
- Kolumna CASES – liczba przypadków białaczki w latach 1978-1982 przypisana do poszczególnych obiektów (regionów spisowych). Wartość ta powinna być liczbą całkowitą, tu jednak, zgodnie z opisem Wallera (1994) część przypadków, która nie mogła zostać obiektywnie przypisana do konkretnego regionu, została podzielona proporcjonalnie. Stąd liczności przypadków przypisanych do 281 obiektów nie są liczbami całkowitymi.
- Kolumna POP – liczność populacji w poszczególnych obiektach.
- Kolumna prev – współczynnik częstości występowania białaczki na 100000 osób, dla każdego obiektu w jednym roku: prev=(CASES/POP)*100000/5

Analiza globalna nie dała jednoznacznego rozstrzygnięcia co do występowania autokorelacji przestrzennej. Sprawdzimy więc, czy uda się znaleźć regiony, gdzie częstość występowania białaczki jest nieprzeciętnie wyższa.

By zlokalizować skupiska białaczki wyliczymy współczynnik G_i oraz G_i*. Do analizy wykorzystamy zmienną prev oraz proponowaną przez program macierz sąsiedztwa według wspólnej granicy – Queen, standaryzowaną rzędami (by wykorzystać inną macierz należy ją najpierw wygenerować - patrz rozdział: Macierz wag przestrzennych). Wybieramy również jedną z poprawek poziomu istotności.

G_raport_Local_G_Ord

G_raport_Local_G_Ord_Star

Uzyskany raport przedstawia wartości lokalnych współczynników, wartości statystyki testowej oraz odpowiadające im wartości prawdopodobieństwa testowego. Znajdziemy tu również informacje o ilości rejonów wyznaczających reżimy przestrzenne (High-High, Low-Low). Do analizy przypisany jest także wynik, który możemy wyrysować na mapie - są to reżimy przestrzenne opisane w raporcie poprzez kolumnę kolor.

G_mapa_leukemia_local_G

G_mapa_leukemia_local_G_gw

Udało się zlokalizować 3 skupiska (6 regionów spisowych w analizie współczynnika G_i i 4 regiony w analizie współczynnika G_i*) gdzie częstość występowania białaczki jest istotnie wyższa. Są to centra klasterów wysokich wartości białaczki oznaczone na mapie kolorem czerwonym.

Uzyskane wyniki możemy dodatkowo zobrazować kolorując mapę wartościami lokalnego współczynnika Getisa i Orda lub też wartościami statystyki testowej bądź wartościami p. Wystarczy jedynie wcześniej przekopiować odpowiednie kolumny z raportu do arkusza danych. W tym przykładzie do kolorowania wykorzystamy wartości statystyki testowej Z(G_i). Po wklejeniu jej do pustej kolumny arkusza danych, w menadżerze map kolorujemy mapę bazową zgodnie z wartościami tej kolumny wybierając odchylenie standardowe o współczynnikiu 3 jako sposób gradacji kolorów. Dodatnie i wysokie wartości statystyki Z_i świadczą o skoncentrowaniu obiektów o wysokich wartościach, wartości ujemne i niskie - obiektów o niskich wartościach, a wartości bliskie zeru wskazują na losowy rozkład badanej zmiennej w przestrzeni.

G_mapa_leukemia_local_G_statystyka

Analizując wygładzoną zmienną prev wzmacniamy efekt klasteryzacji. Uzyskujemy podobny rezultat, czyli 3 skupiska (15 regionów spisowych w analizie współczynnika G_i i 9 regionów w analizie współczynnika G_i*) będące centrami klasterów.

G_mapa_leukemia_local_G_smooth

G_mapa_leukemia_local_G_gw_smooth

FAQ | Polityka prywatności | Kontakt