Blog naukowy

Metodolog.pl - NaukaBlog naukowyMetodolog.plOdporność metod statystycznych

Statystyczna siła efektu

14 stycznia 2017 By Konrad Hryniewicz Metodolog.pl 0 Comments

Odporność metod statystycznych

„O ODPORNOŚCI METOD STATYSTYCZNYCH (DANE NIE SPEŁNIAJĄ WYMAGANYCH ZAŁOŻEŃ)

Poprzez rozważania zawarte w tym wpisie chcę pokazać, iż w analizach statystycznych praktycznie nic nie jest oczywiste i dane raz na zawsze. Szalenie szkodliwy jest zatem jakikolwiek schematyzm w stosowaniu, nawet dobrze znanych i stosunkowo prostych metod statystycznych. Schematyczne (rutynowe) przeprowadzanie analizy statystycznej bardzo łatwo może wyprowadzić badacza na manowce?

Poszukiwanie metod odpornych idzie w dwóch kierunkach. Jeden to taka modyfikacja metod standardowych, aby stały się mało wrażliwe na niespełnianie któregoś z założeń. Najczęściej dotyczy to pewnej modyfikacji liczby stopni swobody znanej statystyki. Drugi kierunek poszukiwań metod odpornych to konstrukcja nowych metod statystycznych, już z założenia niewymagających pewnych założeń, jak np. M-estymatory czy metody bootstrap.

W przypadku wszystkich parametrycznych metod służących do porównywania średnich podstawowe założenia to normalność rozkładu badanej cechy (zmiennej) w populacji generalnej oraz jednorodność (równość) wariancji w porównywanych grupach. Założenia te obowiązywały zarówno dla testu t-Studenta, jak i testów w analizach wariancji. W dwuczynnikowej analizie wariancji z powtarzaniem obserwacji, od strony teoretycznej, niezbędna była sferyczność macierzy wariancji-kowariancji, abyśmy mogli zrealizować jednowymiarową analizę.

Jednakże założenia te w znaczący sposób ograniczają stosowalność tych metod statystycznych. Dlatego też, od momentu udowodnienia odpowiedniego twierdzenia wymagającego takich założeń, podejmowane były próby ich osłabienia i próby te najczęściej były skuteczne. Dla testu t-Studenta, Satterthwaite w 1946 roku i Welch w 1947 zaproponowali metody modyfikacji liczby stopni swobody statystyki t-Studenta i umożliwiło to stosowanie tego testu nawet wówczas, gdy wariancje w grupach nie były jednorodne. Podobna sytuacja miała miejsce w jednoczynnikowej analizie wariancji. Zamiast przy porównywaniu kilku średnich korzystać ze statystyki F-Snedecora o pełnej liczbie stopni swobody dla mianownika, w przypadku niejednorodności wariancji w grupach, korzystamy z testów Welcha i Browna-Forsythea. W testach tych dokonano modyfikacji liczby stopni swobody mianownika w statystyce F-Snedecora. I założenie jednorodności wariancji w grupach przestało być ograniczeniem. W dwuczynnikowej analizie wariancji z powtarzaniem obserwacji (dwuczynnikowej analizie wariancji dla zmiennych zależnych) także stosowane były pewne modyfikacje zmieniające liczbę stopni swobody w statystyce F-Snedecora. Modyfikacje te, zaproponowane przez Huynha i Feldta oraz Geissera i Green- housea umożliwiły wykorzystywanie statystyki F-Snedecora w przypadku braku sferyczności macierzy wariancji-kowariancji.

Pojęcie odporności

Poszukując rozwiązań w przypadkach, gdy niespełnione są podstawowe założenia stosowalności określonego testu statystycznego lub metody estymacji, Czytelnik napotka pojęcie odporności (robustness, robust testing, robust estimation, robust statistics, robust inference). Analogicznie jak w przypadku pojęcia prawdopodobieństwa czy ryzyka, nie powinno się mówić o abstrakcyjnym pojęciu odporności, lecz zawsze należy określać czego dotyczy odporność stosowanej metody statystycznej.

W literaturze spotykamy się z dwoma aspektami odporności. Jeden to odporność metod statystycznych lub statystyk na pojawiające się tzw. wartości odstające (outliers) (Ripley, 2004), drugi to odporność tych metod na niespełnianie podstawowych założeń (Hampel, 2000; 2001). Można także spotkać się z poglądem, że odporność jest pojęciem budzącym poważne wątpliwości (Bradley, 1978), lecz tego ostatniego wątku nie będziemy rozwijać.

Wartości odstające nie muszą być błędnymi, mogą to być wartości poprawne, a fakt, że w tej próbie zostały potraktowane jako odstające może wynikać z dużego rozrzutu badanego parametru. Bardzo często parametry biologiczne charakteryzują się dużą zmiennością. Wartość odstająca powinna, w każdym przypadku, zostać dokładnie sprawdzona, nim zostanie uznana za wartość błędną. Nie powinniśmy zatem zbyt pochopnie usuwać ze zbioru danych wartości odstających, a w praktyce nigdy nie powinniśmy usuwać żadnych obserwacji ze zbioru danych, z wyjątkiem takich, o których wiemy, że są wynikiem błędu, np. błędu zapisu (przesunięcie przecinka w liczbie ułamkowej), błędu pomiaru (uszkodzony został instrument pomiarowy), zanieczyszczenie materiału biologicznego, świadomego zafałszowania testu psychologicznego itp. Mimo swojej merytorycznej poprawności wartości odstające mogą wprowadzać zamęt do standardowych metod statystycznych, dlatego też od lat sześćdziesiątych ubiegłego wieku intensywnie są one modyfikowane, by zmniejszyć ich wrażliwość na występowanie wartości odstających. W statystycznej literaturze angielskojęzycznej występuje kilka rodzajów odporności, nazywanych: robust, resistant, stable. Różnice nazewnictwa wynikają bardziej z obszaru zastosowań (nauki przyrodnicze, zastosowania inżynierskie, nauki społeczne) niż różnic we właściwościach metod. Problemy te omawia szerzej Erica Jen (2002).

W naszych rozważaniach nie będziemy zajmowali się odpornością metod na wartości odstające, a zajmiemy się drugim rodzajem odporności, tzn. zachowaniem się metod statystycznych, gdy nie są spełnione ich podstawowe założenia. Warto jednakże zauważyć, że występowanie wartości odstających może zniekształcać postać rozkładu prawdopodobieństwa badanej cechy, zatem nie da się do końca rozdzielić tych dwóch typów odporności. Jeśli w próbie pojawi się kilka wartości bardzo dużych, wpłynie to na wartość współczynnika skośności, co z kolei pociągnie za sobą decyzję, iż rozkład prawdopodobieństwa nie jest rozkładem normalnym. Gdy wartości takie możemy uznać za będące rezultatem popełnionego błędu, np. pomiarowego, to ich usunięcie uzdrawia sytuację. W przeciwnym przypadku, gdy wartości odstające są wartościami prawidłowymi. mamy do czynienia z rozkładem różnym od normalnego. Z rozważań tych wynika, że nie do końca można rozdzielić odporność na wartości odstające od odporności na niespełnianie podstawowych założeń stosowanej metody statystycznej. W badaniach psychologicznych rzadziej sprawiają kłopoty wartości odstające, a większym problemem są teoretyczne założenia stosowanych metod statystycznych.

Stosowanie metod statystycznych do opracowywania wyników badań i wyciągania odpowiednich wniosków nazywane bywa wnioskowaniem statystycznym. Wnioskowanie statystyczne będziemy traktowali jako odporne, jeśli będzie ono niewrażliwe na (mniejsze albo większe) odchylenia od założeń, przy których było otrzymane.

Tego typu odporność może dotyczyć różnych aspektów wnioskowania, np. postaci rozkładu prawdopodobieństwa statystyki będącej podstawą testu, wartości tej statystyki, mocy testu, wartości estymatora itp.

Potrzeba stosowania procedur odpornych była zawsze oczywista dla wybitnych statystyków-praktyków jak Newcomb, Pearson, Gosset („Student”), Jeffreys. Było to przekonująco wykazane przez E.S. Pearsona dla testów i J.W. Tukeya dla estymatorów. Tukey (1960) wykazał brak odporności średniej arytmetycznej nawet przy nieznacznych odstępstwach od normalności.

Znaczna j część procedur statystycznych, będących dziś w powszechnym użyciu, powstała I przy rozwiązywaniu problemów teoretycznych i praktycznych. Wielu czołowych współtwórców statystyki, łącznie z tymi, którzy wnieśli wkład w jej podstawy matematyczne, miało w swojej pracy bliski kontakt z analizą danych pochodzących z badań. Z punktu widzenia historycznego, zainteresowanie statystyków zagadnieniem praktycznych zastosowań zdobyczy teoretycznych okazało się bardzo twórcze i takie prawdopodobnie będzie zawsze.”

Cytat tekstu: Wiesław Szymczyk (2010) – Podstawy statystyki dla psychologów. Podręcznik akademicki. wyd. Difin. s. 287.