Hierarchiczna analiza skupień Metodolog.pl

Hierarchiczna analiza skupień

Hierarchiczna analiza skupień – Hierarchiczne rozwiązanie skupień ma zastosowanie do mniejszych wolumenów danych. Można dzięki tej procedurze można klasyfikować zmienne (podobnie jak w analizie czynnikowej) oraz obserwacje. Ma możliwość zapisu minimalnej i maksymalnej ilości skupień oraz zapisania informacji o przynależności. Metoda ta jest bogata w metody formowania skupień, przekształceń zmiennych oraz pomiaru podobieństwa/niepodobieństwa pomiędzy skupieniami. Niestety mankamentem hierarchicznej analizy skupień jest to, że wymaga ona jednolitego typu danych (liczebności, ilościowych i zmiennych jakościowych) oraz zastosowania odpowiednich miar odległości lub podobieństwa dla rodzaju analizowanych danych. Analiza hierarchiczna jest metodą eksploracyjną, wyniki analizy powinny być poddawane bardziej formalnym procedurom. Dla zmiennych ilościowych dedykowane są odległości : euklidesowe, kwadrat odległości euklidesowej, korelacja Pearsona, odległość miejska (prostokątna), odległość Mińkowskiego-Harabasza, odległość Czybyszewa. Dla zmiennych porządkowych dedykowana jest odległość chi kwadrat i phi kwadrat. W przypadku zmiennych binarnych są dedykowane odległości: euklidesowa, kwadrat odległości euklidesowej, różnica wielkości, lambda, miara Dice’a, miara Kulczyńskiego, miara Ochiai oraz Q Yule’a. Procedura ta jest bardzo uniwersalna można ją stosować w postępowaniu eksploracyjnym BIG DATA, drążeniu danych, biostatyce, biometrii i psychometrii. Ta procedura analityczna jest dostępna w większości pakietów statystycznych (analiza SPSS, analiza SAS, analiza Statistica, analiza GNU R, analiza Orange Canvas ).