Statystyka opisowa
Od czego najlepiej zacząć analizę danych, gdy już wszystkie pracowicie wprowadzimy do programu i nie mamy pojęcia co dalej? Musimy się zaznajomić z naszymi danymi i zobaczyć co tak naprawdę udało nam się zebrać i jakie analizy będzie można na tych danych przeprowadzić. Do tego służą nam statystyki opisowe. Statystyka opisowa pozwala nam obiektywnie zobrazować różne aspekty naszych danych liczbowych.
Statystyki opisowe najczęściej dotyczą jednej zmiennej czyli wybranej właściwości z naszego zbioru danych, która przyjmuje co najmniej dwie różne wartości (np. płeć osoby badanej). Zmienne dzielimy na grupy ze względu na ich różne własności. Najpopularniejszym i najbardziej praktycznym podziałem jest podział Stevensa.
Stevens wyróżnił:
- Skalę nominalną – mamy tylko kategorię dla osoby badanej
- Skalę porządkową – kategorie mogą zostać ułożone od najmniejszej do największej
- Skalę interwałową – posiada jednostkę, wiemy o ile obserwacje się od siebie różnią
- Skalę ilorazową – posiada zero bezwzględne, wiemy ile razy obserwacje się różnią
Skale interwałowe i ilorazowe nazywamy często łącznie skalą ilościową.
Do podstawowego opisu statystycznego zmiennych stosujemy miary tendencji centralnej i miary rozproszenia.
Miary tendencji centralnej:
DOMINANTA – określa wartość najczęstszą w danym zbiorze, może być stosowana dla każdej skali
MEDIANA – jest to wartość środkowa w uporządkowanym wg wielkości zbiorze, może być stosowana dla skal porządkowych i ilościowych.
KWARTYL – kwartyle dzielą uporządkowaną grupę na cztery równe części
ŚREDNIA ARYTMETYCZNA – wartość przeciętna, ma zastosowanie tylko dla skal ilościowych
Miary rozproszenia:
ROZSTĘP – różnica między maksymalną a minimalną wartością w grupie
ODCHYLENIE ĆWIARTKOWE – jest to różnica między trzecim i pierwszym kwartylem podzielona przez dwa
ODCHYLENIE ŚREDNIE – jest to średnia arytmetyczna bezwzględnych odchyleń pomiarów od średniej arytmetycznej w próbie
ODCHYLENIE STANDARDOWE – jest to pierwiastek z sumy kwadratów odchyleń od średniej poszczególnych obserwacji podzielonej przez liczbę obserwacji. Kwadrat odchylenia standardowego to WARIANCJA – najszerzej stosowana miara zmienności zmiennej
WSPÓŁCZYNNIK ZMIENNOŚCI – jest równy ilorazowi odchylenia standardowego i średniej arytmetycznej. Dla danych porządkowych stosowany jest pozycyjny współczynnik zmienności oparty na medianie i odchyleniu ćwiartkowym. Wartość współczynnika zmienności poniżej 0,5 świadczy o niewielkim zróżnicowaniu, wartości z przedziału 0,5-1 wskazują na umiarkowane zróżnicowanie, a wartości powyżej 1 świadczą o bardzo dużym zróżnicowaniu.
Autorem tekstu jest Marta Mrozek.