analiza statystyczna w nauce

Etapy wnioskowania statystycznego i wybór odpowiedniego testu.

meto

 

Na etapy wnioskowania statystycznego i wyboru testu składają się następujące punkty:

-sformułowanie hipotezy zerowej i alternatywnej

-określenie skali pomiarowej badanej zmiennej

-wybór testu statystycznego

-określenie poziomu istotności alfa dla testu statystycznego i wielkości próby N

-określenie rozkładu z próby statystyki danego testu statystycznego przy założeniu słuszności hipotezy zerowej

-określenie obszaru odrzuceń hipotezy zerowej

-obliczenie wartości statystyki testu i podjęcie decyzji odnośnie hipotezy zerowej

Przy wyborze odpowiedniego testu statystycznej istotności różnic należy wziąć pod uwagę 4 rzeczy:

  1. Skala pomiarowa (zmiennej zależnej)

-nominalna

-porządkowa

-interwałowa lub ilorazowa

  1. Liczebność grup

-małe (do 30 osób)

-duże (powyżej 30 osób)

3.Liczba porównywanych grup

-testy dla jednej grupy

-testy dla dwóch grup

-testy dla więcej niż dwóch grup

  1. Grupy zależne lub niezależne (techniki wyboru osób do próby)

Gdy już odpowiemy sobie na powyższe pytania z łatwością dobierzemy odpowiedni test statystyczny.

Pomiar zmiennej interwałowej

Autorem tekstu jest Marta Mrozek.

POMIAR ZMIENNEJ NA SKALI NOMINALNEJ

GRUPY ZALEŻNE                                                                        GRUPY NIEZALEŻNE

test McNemary                                              Małe liczebności                     Duże liczebności

Test Fishera                            Test Chi-kwadrat

POMIAR ZMIENNEJ NA SKALI PORZĄDKOWEJ

DWIE GRUPY                                                         WIĘCEJ NIŻ DWIE GRUPY

GRUPY ZALEŻNE  GRUPY NIEZALEŻNE

GRUPY ZALEŻNE  GRUPY NIEZALEŻNE

Test Wilcoxona          Test Manna-Whitneya

Test Friedmana           Test Kruskala-Wallisa

POMIAR ZMIENNEJ NA SKALI INTERWAŁOWEJ

JEDNA GRUPA                   DWIE GRUPY                     WIĘCEJ NIŻ DWIE GRUPY

Duża   Mała                            Zależne           Niezależne                              ANOVA

Test Z     Test t dla  jednej średniej                Duża        Mała                         Duża   Mała

jednej średniej

Test Z dla                   Test t dla         Test Z dla dwóch średnich

danych zależnych       danych zależnych

Badamy homogeniczność                                                                                                     wariancji

wariancje w grupach są równe     wariancje w grupach różnią się

Test t dla dwóch średnich                 Test t dla dwóch średnich z poprawką na nierówność wariancji

analiza statystyczna wyników badań

Wielkość i siła efektu – podstawowe miary szacujące siłę związków i wpływów.

meto

 

Wielkość efektu weryfikują miary siły efektu.

Wielkość efektu jest ilościową miarą siły zjawiska obliczaną na podstawie danych. Stosuje się ją do mierzenia wpływu pewnego czynnika na wynik ogólny grupy, czyli siły związku między zmienną niezależną a zmienną zależną. Wielkość efektu nie jest zależna od wielkości próby, a jego interpretacja opiera się na założeniu o normalności rozkładów wyników porównywanych grup.

Miary wielości efektu dzielą się na dwie rodziny. Jest to rodzina d, w skład której wchodzą:
d Cohena (dla testu t dla prób zależnych) oraz g Hedgesa (dla testu t dla prób niezależnych).  W skład rodziny r wchodzą miary takie jak: eta-kwadrat, omega-kwadrat oraz r ( jest to współczynnik korelacji punktowo-dwuseryjnej  między grupą eksperymentalną a kontrolną, wyniki są zmienną o charakterze ciągłym).

Tab. Miary wielkości / siły efektu oraz przyjmowane przez nie wartości dla poszczególnych testów. Źródło: Internet

Miary wielkości / siły efektu Przedział wartości siły związku
Test t dla 2 średnich niezależnych i zależnych 1. d Cohena

2. g Hedgesa

3. r punktowo-dwuseryjny między grupami

d Cohena, g Hedgesa:

0.2 – efekt mały

0.5 – efekt przeciętny

0.8 – efekt duży

Jednoczynnikowa ANOVA 1. Eta-kwadrat

2. Omega-kwadrat

Eta-kwadrat <0,1>

Omega-kwadrat

0.01 – efekt mały

0.06 – efekt przeciętny

0.14 – efekt duży

Dwuczynnikowa ANOVA 1. Eta-kwadrat

2. Cząstkowa omega-kwadrat

Eta-kwadrat <0,1>

Omega-kwadrat

0.01 – efekt mały

0.06 – efekt przeciętny

0.14 – efekt duży

Chi-kwadrat Współczynnik Fi

Fi Cramera

0.1 – efekt mały

0.3 – efekt przeciętny

0.5 – efekt duży

Test Kruskala-Wallisa Epsilon-kwadrat <0,1>
Test U Manna-Whitneya rg Rangowy współczynnik korelacji dwuseryjnej Glassa <-1,1>
Test rang Friedmana Współczynnik zgodności W <0,1>
Test znaków rangowanych Wilcoxona rc Rangowy współczynnik korelacji dwuseryjnej dla par dopasowanych <-1,1>

Poszczególne analizy wymagają zastosowania określonych miar wielkości efektu. W dalszej części tekstu po kolei się im przyjrzymy.

Dla jednoczynnikowej analizy wariancji miarą wielkości efektu będzie Eta-kwadrat (stosunek korelacyjny) oraz Omega-kwadrat dla grup niezależnych. Miara Eta-kwadrat szacuje proporcję całkowitej wariancji, którą można przypisać zmiennej niezależnej. Jest ona jednak obciążona, gdyż podwyższa szacowane wartości.
ɳ2 = SSm/SSc 

gdzie: SSm – międzygrupowa suma kwadratów ; SSc – całkowita suma kwadratów

Omega kwadrat to względnie nieobciążona miara wielkości efektu w ANOVA dla grup niezależnych. Miara Omega-kwadrat szacuje proporcję wariancji zmiennej zależnej w populacji, którą możemy przypisać k warunkom eksperymentalnym.

ω2m = [SSm – (k – 1)(s2wew)]/(SSc + s2wew)

gdzie: SSm – międzygrupowa suma kwadratów;  SSc – całkowita suma kwadratów; s2wew – wewnątrzgrupowe oszacowanie wariancji

Miara wielkości efektu w ANOVA dla pomiarów powtarzanych to Eta-kwadrat dla pomiarów powtarzanych.  Miara ta szacuje tę proporcję zróżnicowania, którą można przypisać zmiennej niezależnej po wyeliminowaniu zróżnicowania spowodowanego różnicami indywidualnymi.

ɳ2 = SS2osoby/(SS2osoby + SS2reszta)

Miarą wielkości efektu w ANOVA dla planu dwuczynnikowego jest Eta-kwadrat dla planu dwuczynnikowego.

ɳ2wiersze = SSW/SSc

ɳ2kolumny = SSK/SSc

ɳ2WK = SSWK/SSc

gdzie: SSW –suma kwadratów dla wiersza; SSK – suma kwadratów dla kolumny; SSWK – suma kwadratów dla interakcji WK; SSc – całkowita suma kwadratów

Miarą siły związku między zmienną zależną a efektem eksperymentalnym każdego z czynników jest cząstkowa Omega-kwadrat dla planu czynnikowego.

ω2= oszacowanie wariancji dla (W, K oraz WK)/ [oszacowanie wariancji dla (W, K oraz WK) + oszacowanie wariancji wewnątrz kratek]

gdzie: W – liczba wierszy; K – liczba kolumn

Dane jakościowe również posiadają własne miary do oceniania wielkości efektu. Popularnie używane miary związku dla testu chi-kwadrat to współczynnik Phi oraz V Cramera. Współczynnik Phi jest związany z punktowo-dwuseryjną korelacją oraz z d Cohena i oszacowuje rozmiar związku pomiędzy dwoma zmiennymi (2×2). Natomiast V Craméra jest rozszerzeniem współczynnika fi i może być użyty ze zmiennymi o większej ilości kategorii.

Współczynniki fi=√χ2/n

V Cramera√χ2/n(df mniejsze)

V Cramera możemy przekształcić na wartość omega-kwadrat. Według Cohena można przyjąć, że omega kwadrat wynosząca 0,1 – oznacza mały efekt; 0,3 – przeciętny efekt a 0,5 – duży efekt.

Wielkość efektu jest ważna również w badaniach korelacyjnych. W przypadku analizy regresji miarami wielkości efektu są: statystyka R2 oraz współczynnik f 2 Cohena. Statystyka R2 mówi o stopniu dopasowania modelu do danych. Pokazuje jaki procent wariancji zmiennej zależnej można wyjaśnić za pomocą predykatorów. Współczynnik f 2 Cohena, wykorzystujący statystykę R2, stosowany jest w modelu regresji wielokrotnej.

 Współczynnik f 2 Cohena=R2/1-R2

W przypadku eksploracyjnej analizy czynnikowej miarą wielkości efektu jest łączny procent wariancji wyjaśnianej przez wyodrębnione czynniki. W przypadku konfirmacyjnej analizy czynnikowej stosujemy test chi-kwadrat (Jest to miara dobroci dopasowania modelu do danych) oraz wskaźniki GFI (wskaźnik dobroci dopasowania) oraz AGFI (skorygowany wskaźnik dobroci dopasowania), które porównują wyjściową oraz odtworzoną macierz kowariancji. Innymi miarami wielkości efektu dla konfirmacyjnej analizy czynnikowej jest pierwiastek ze średniego kwadratu reszt (RMR) oraz pierwiastek ze średniego kwadratu błędu aproksymacji (RMSEA). Pokazuje on średnią z macierzy pozostałości po dopasowaniu modelu (macierz reszt). Jego poprawną interpretację zapewnia odniesienie go do wielkości kowariancji z macierzy korelacji zmiennych obserwowalnych. Wysoka wartość RMR wskazuje na złe dopasowanie modelu. Z kolei pierwiastek ze średniego kwadratu błędu aproksymacji (RMSEA) szacuje wielkość popełnianego błędu aproksymacji w populacji.

Miarą wielkości efektu dla modelu analizy ścieżek Path Analysis jest, analogicznie jak w przypadku analizy regresji, statystyka R2.

W przypadku, gdy jedyną alternatywą jest brak jakiegokolwiek wskaźnika wielkości efektu próba jest mała i inne wskaźniki mogą wprowadzać w błąd, gdy zastosowano metody nieparametryczne dla których brak określonych ściśle wskaźników lub gdy badanie zbliżone jest formą do badania standardowego, stosujemy wskaźnik requivalent.  Jest to wskaźnik wielkości efektu, który można odczytać z tablic bądź obliczyć przy pomocy wzoru:

r=√t2/t2+(N+2)

Źródła:

Brzeziński, J. (2004). Metodologia badań psychologicznych. Warszawa: Wydawnictwo Naukowe PWN

King, B., Minium, E. (2009). Statystyka dla psychologów i pedagogów. Warszawa: Wydawnictwo Naukowe PWN

 Więcej na:

Jakie jest stanowisko asa (Amerykanskie Stowarzyszenie Statystyczne) na temat wartości p (istotnosci statystycznej) w odniesieniu do psychologii/