Normalizacja danych to skalowanie danych do przedziaŁu, na przykŁad do przedziaŁu [-1, 1] lub [0,1].
Normalizacja min-max
Normalizacja min-max przy pomocy funkcji liniowej sprowadza dane do wskazanego przez użytkownika przedziału (newmin, newmax). Powinniśmy przy tym znać zakres jaki mogą osiągnąć dane. Jeśli nie znamy tego zakresu, możemy posłużyć się wartością największą i najmniejszą występującą w analizowanym zbiorze (w oknie Normalizacja/Standaryzacja zaznaczamy wtedy opcję oblicz z próby).
Normalizacja logarytmiczna
Normalizacja przy pomocy funkcji logarytmicznej (S-kształtnej) sprowadza dane do przedziału (0,1).
Jeśli tak przekształcone dane chcemy rozciągnąć na innym przedziale, wówczas w oknie Normalizacja/Standaryzacja należy wprowadzić zakres nowego przedziału.
Funkcja normalizująca ze współczynnikiem
Normalizacja ta sprowadza dane do przedziału (-1,1) przy pomocy funkcji S-kształtnej o zmieniającym się współczynniku normalizacji α
Zwiększenie wartości współczynnika α tworzy wykres o bardziej łagodnym zboczu. Jeśli tak przekształcone dane chcemy rozciągnąć na innym przedziale, wówczas w oknie Normalizacja/Standaryzacja należy wprowadzić zakres nowego przedziału.
Standaryzacja
Standaryzacja, to przekształcenie danych, w wyniku którego zmienna uzyskuje średnią równą 0 a odchylenie standardowe równe 1.
Przykład (plik PL_normalizacja.pqs)
Dokonaj przekształcenia wszystkich zmiennych zawartych w pliku
a) stosując normalizację min-max do przedziału [0,10];
b) stosując normalizację logarytmiczną;
c) stosując normalizację ze współczynnikiem;
d) stosując standaryzację.