Eksploracja danych

Eksploracja danych  eksploracja danych pozwala na tworzenie statystyk podsumowujących oraz wizualizacje danych pozwalające na szczegółowy przegląda wyników w różnych konfiguracjach grup i zmiennych. Eksploracja pomaga w klasyfikowaniu danych, identyfikacji obserwacji skrajnych, ich opisaniu, sprawdzeniu założeń, przekształcaniu zmiennych. Podczas eksploracji danych pozwala także na identyfikacje różnic pomiędzy podgrupami obserwowanych zmiennych. Eksploracja danych pozwala na ustalenie jakich metod estymacji  i jakich metod statystycznych można użyć w dalszej analizie. Niezależnie od podejścia np. data mining, big data czy modelowania, zawsze pierwszym etapem jest wizualna i mniej formalna eksploracja danych. To od prawidłowo wykonanej eksploracji i oczyszczeniu danych zależy dalsza prawidłowa analiza.

Kurtoza

Kurtoza – Jest to miara koncentracji wyników wokół średniej. Jeśli wartość kurtozy jest większa niż zero, to znaczy, że wyniki są skoncentrowane blisko średniej. Jeśli jednak kurtoza jest niższa niż zero, to rozkład jest bardziej smukły i wartości koncentrują się bliżej średniej.

Skośność

Skośność – Jest to miara asymetrii/dyspersji rozkładu. Opisuje ona kształt i symetrię analizowanego rozkładu zmiennej ilościowej. W przypadku kiedy skośność jest prawostrona znaczy to tyle, że wyniki są skoncentrowane przy niskich wartościach cechy. Jeśli rozkład jest lewo skośny, czyli jest lewostronna to znaczy, że wyniki są skoncentrolne przy wysokich wartościach cechy.

Błąd standardowy dla średniej

Błąd standardowy dla średniej – nie jest miarą rozproszenia wyników pomiarowych, lecz określa stopień dokładności, z jaką możemy określić wartość średniej arytmetycznej w populacji na podstawie wyznaczenia średniej w analizowanej próbie.

Min/Max

Min/Max – Minimalna i maksymalna wartość ze zbioru.