Analiza wariancji w psychologii Metodolog.pl

Analiza wariancji jest jednym z najczęściej wykorzystywanych parametrycznych testów statystycznych.

Niedowiarki mogą przekartkować wiodące czasopisma psychologii eksperymentalnej. Ten wpis dostarczy niezbędnych informacji teoretycznych i praktycznych pozwalających na samodzielne wykonywanie tego typu analiz w prostych schematach, opis bardziej złożonych zawierają poprzednie wpisy. Mamy nadzieję, że dzięki temu wpisowi wielokrotnie powtarzane zdanie, będące wprowadzeniem do opisu wyników z badania: „W celu weryfikacji hipotezy… przeprowadzono jednoczynnikową analizę wariancji…” przestanie brzmieć tajemniczo.

Jednoczynnikową analiza wariancji (one-way Analysis Of Variance, ANOVA)

Jest to uogólniony test różnic między średnimi. Najprościej, możemy ją rozumieć jako rozszerzenie testu t. Podobnie jak testy t, analizę wariancji stosujemy zarówno w planach dla grup niezależnych, jak i do danych zebranych w badaniach z planami dla grup zależnych. Stosujemy ją wtedy, gdy testując naszą hipotezę chcemy zbadać wpływ jednej zmiennej niezależnej’, zwanej tutaj czynnikiem, która posiada dwie lub więcej wartości, na zmienną zależną. Podsumowując, jednoczynnikowa analiza wariancji pozwala porównać więcej niż dwie grupy. W niniejszym wpisie skupimy uwagę na analizie wariancji zastosowanej do danych zebranych w badaniach w planie dla grup niezależnych.

Rozważmy przypadek psychologicznych badań o bardzo aplikacyjnym charakterze.

Reklamodawcom na całym świecie zależy na podniesieniu efektywności emitowanych reklam telewizyjnych. Powszechnie uważa się, iż najlepszym czasem reklamowym jest 5 minut pomiędzy serwisem informacyjnym a serwisem pogodowym. Prawidła psychologii społecznej wskazują, że kontekst ma niebagatelne znaczenie dla odebranego komunikatu: poziomu jego zapamiętania, perswazyjności, jak również atrakcyjności. W związku z tym można się spodziewać, że reklamy wyświetlane tuż po serwisie informacyjnym będą odbierane różnie, w zależności od tego, jaka wiadomość była przekazana jako ostatnia. Zapewne inaczej (odebrana zostanie reklama nowej farby do włosów o intensywnym czerwonym kolorze tuż po relacji z konfliktu zbrojnego, a inaczej po relacji z występów celtyckiego zespołu tanecznego.

 Wyobraźmy sobie, że jedna ze stacji telewizyjnych zdecydowała się przeprowadzić eksperyment, naturalny, aby odpowiedzieć na pytanie, jak treść ostatniej wiadomości w serwisie wpływa na skuteczność następujących po nim reklam. Eksperyment polegał na tym, że w każdym z trzech losowo wybranych regionalnych ośrodków telewizyjnych jako ostatnią pokazywano inną wiadomość. W jednym serwisie informacyjnym jako ostatnią pokazano relację z wojny, w drugim z obrad parlamentu, a w trzecim z występów zespołu tańca celtyckiego. W ten sposób manipulowano zmienną niezależną — ładunkiem emocjonalnym ostatniej wiadomości w serwisie. Tuż po zaprezentowanej informacji we wszystkich trzech ośrodkach TV pojawiała się taka sama reklama nowej, intensywnie czerwonej farby do włosów. Wskaźnikiem zmiennej zależnej był procentowy wzrost sprzedaży reklamowanej farby w losowo wybranych dwudziestu sklepach kosmetycznych z danego regionu. Warto zwrócić uwagę, że obserwacjami w opisywanym eksperymencie nie były osoby badane, a wybrane sklepy.

Przyglądając się wynikom surowym widzimy, że w każdym sklepie sprzedaż wzrosła, gdyż wartości zmiennej zależnej są dodatnie i większe od zera. To może cieszyć producenta reklamowanej farby do włosów. Zauważalny „gołym okiem” jest także fakt, że procentowy wzrost sprzedaży ma spore zróżnicowanie – waha się od 3% aż do 52%. Potencjalna lista czynników wpływających na wielkość wzrostu sprzedaży może być bardzo długa, lecz mamy nadzieję, że wśród nich była również treść wiadomości poprzedzająca reklamę farby (czyli nasza manipulacja eksperymentalna). Co więcej, liczymy na to, że jest to główny czynnik powodujący zróżnicowanie wzrostów sprzedaży!

Przystępując do przeprowadzenia analizy wariancji chcemy sprawdzić, jaki jest stosunek zmienności (wariancji) wyników spowodowanej manipulacją eksperymentalną do zróżnicowania (wariancji) sprzedaży, którego przyczyną są wszystkie inne czynniki oraz błąd pomiaru, np. przystojny i miły sprzedawca. Zależy nam, aby wyniki wewnątrz każdej grupy wyróżnionej na podstawie manipulacji eksperymentalnej były jak najbardziej do siebie podobne (tzn. wariancja wyników w każdej grupie była jak najmniejsza). W tym celu patrzymy, na ile wyniki w danym warunku różnią się od średniego wzrostu sprzedaży w tej grupie. Gdyby wpływ na wzrost sprzedaży miała tylko nasza manipulacja, różnice między średnimi obliczonymi z wyników w poszczególnych grupach a ogólnym średnim wzrostem sprzedaży byłyby duże. Znaczyłoby to, że to właśnie nasza manipulacja sprawiła, że grupy różnią się między sobą.

Różnice pomiędzy średnimi w grupach a średnią ogólną nazywamy wariancją międzygrupową. Zakładamy, że wrynika ona z oddziaływania czynnika. Zmienność wyników wewnątrz poszczególnych grup, a więc różnice między poszczególnymi wynikami a średnią grupową, nazywana jest wariancją wewnątrzgrupową lub wariancją błędu. Spowodowana jest ona wpływem innych czynników niż zmienna niezależna, a także błędem pomiaru. Całkowita zmienność wyników została więc w analizie wariancji rozbita na wariancję, którą możemy przypisać efektowi oddziaływania wyprowadzonego czynnika oraz zmienność, której nasza intuicja badacza nie jest w stanie wyjaśnić, czyli wariancję błędu. Porównując te dwa źródła zmienności pamiętajmy, iż zależy nam, aby wariancja międzygrupową była jak największa w porównaniu z wariancją wewnątrz grupową.

Podsumujmy więc – w analizie wariancji porównujemy wielkość wariancji międzygrupowej z wariancją wewnątrzgrupową. W ten sposób otrzymujemy wartość statystyki F (F pochodzi od pierwszej litery nazwiska jej twórcy – Ronalda Aylmera Fishera, angielskiego statystyka i biologa), na podstawie której sprawdzamy, czy różnice pomiędzy średnimi grupowymi są istotne statystycznie.

F=MSmg/MSwg

MS=średni kwadrat – mean squere

MSmg – wariancja międzygrupowa

MSwg – wariancja wewnątrzgrupowa