Dane binarne w statystyce

Statystyka opisowa – statystyczny opis danych.

meto

Statystyka opisowa

Od czego najlepiej zacząć analizę danych, gdy już wszystkie pracowicie wprowadzimy do programu i nie mamy pojęcia co dalej? Musimy się zaznajomić z naszymi danymi i zobaczyć co tak naprawdę udało nam się zebrać i jakie analizy będzie można na tych danych przeprowadzić. Do tego służą nam statystyki opisowe. Statystyka opisowa pozwala nam obiektywnie zobrazować różne aspekty naszych danych liczbowych.

Statystyki opisowe najczęściej dotyczą jednej zmiennej czyli wybranej właściwości z naszego zbioru danych, która przyjmuje co najmniej dwie różne wartości (np. płeć osoby badanej). Zmienne dzielimy na grupy ze względu na ich różne własności. Najpopularniejszym i najbardziej praktycznym podziałem jest podział Stevensa.

Stevens wyróżnił:

  1. Skalę nominalną – mamy tylko kategorię dla osoby badanej
  2. Skalę porządkową – kategorie mogą zostać ułożone od najmniejszej do największej
  3. Skalę interwałową – posiada jednostkę, wiemy o ile obserwacje się od siebie różnią
  4. Skalę ilorazową – posiada zero bezwzględne, wiemy ile razy obserwacje się różnią

Skale interwałowe i ilorazowe nazywamy często łącznie skalą ilościową.

Do podstawowego opisu statystycznego zmiennych stosujemy miary tendencji centralnej i miary rozproszenia.

Miary tendencji centralnej:

DOMINANTA – określa wartość najczęstszą w danym zbiorze, może być stosowana dla każdej skali

MEDIANA – jest to wartość środkowa w uporządkowanym wg wielkości zbiorze, może być stosowana dla skal porządkowych i ilościowych.

KWARTYL – kwartyle dzielą uporządkowaną grupę na cztery równe części

ŚREDNIA ARYTMETYCZNA – wartość przeciętna, ma zastosowanie tylko dla skal ilościowych

Miary rozproszenia:

ROZSTĘP – różnica między maksymalną a minimalną wartością w grupie

ODCHYLENIE ĆWIARTKOWE – jest to różnica między trzecim i pierwszym kwartylem podzielona przez dwa

ODCHYLENIE ŚREDNIE – jest to średnia arytmetyczna bezwzględnych odchyleń pomiarów od średniej arytmetycznej w próbie

ODCHYLENIE STANDARDOWE – jest to pierwiastek z sumy kwadratów odchyleń od średniej poszczególnych obserwacji podzielonej przez liczbę obserwacji. Kwadrat odchylenia standardowego to WARIANCJA – najszerzej stosowana miara zmienności zmiennej

WSPÓŁCZYNNIK ZMIENNOŚCI – jest równy ilorazowi odchylenia standardowego i średniej arytmetycznej. Dla danych porządkowych stosowany jest pozycyjny współczynnik zmienności oparty na medianie i odchyleniu ćwiartkowym. Wartość współczynnika zmienności poniżej 0,5 świadczy o niewielkim zróżnicowaniu, wartości z przedziału 0,5-1 wskazują na umiarkowane zróżnicowanie, a wartości powyżej 1 świadczą o bardzo dużym zróżnicowaniu.

Autorem tekstu jest Marta Mrozek.

Potrzebujesz wsparcia lub usług statystyczno-metodologicznych? Napisz do nas lub zadzwoń. Oferujemy niskie ceny przy badaniach korelacyjnych i prostych eksperymentach!

Władzą jest wiedza o źródłach zmienności Metodolog.pl motto