Statystyczna siła efektu

Odporność metod statystycznych

„O ODPORNOŚCI METOD STATYSTYCZNYCH (DANE NIE SPEŁNIAJĄ WYMAGANYCH ZAŁOŻEŃ)

 Poprzez rozważania zawarte w tym wpisie chcę pokazać, iż w analizach statystycznych praktycznie nic nie jest oczywiste i dane raz na zawsze. Szalenie szkodliwy jest zatem jakikolwiek schematyzm w stosowaniu, nawet dobrze znanych i stosunkowo prostych metod statystycznych. Schematyczne (rutynowe) przeprowadzanie analizy statystycznej bardzo łatwo może wyprowadzić badacza na manowce?

Poszukiwanie metod odpornych idzie w dwóch kierunkach. Jeden to taka modyfikacja metod standardowych, aby stały się mało wrażliwe na niespełnianie któregoś z założeń. Najczęściej dotyczy to pewnej modyfikacji liczby stopni swobody znanej statystyki. Drugi kierunek poszukiwań metod odpornych to konstrukcja nowych metod statystycznych, już z założenia niewymagających pewnych założeń, jak np. M-estymatory czy metody bootstrap.

W przypadku wszystkich parametrycznych metod służących do porów­nywania średnich podstawowe założenia to normalność rozkładu badanej ce­chy (zmiennej) w populacji generalnej oraz jednorodność (równość) warian­cji w porównywanych grupach. Założenia te obowiązywały zarówno dla testu t-Studenta, jak i testów w analizach wariancji. W dwuczynnikowej analizie wariancji z powtarzaniem obserwacji, od strony teoretycznej, niezbędna była sferyczność macierzy wariancji-kowariancji, abyśmy mogli zrealizować jedno­wymiarową analizę.

Jednakże założenia te w znaczący sposób ograniczają stosowalność tych metod statystycznych. Dlatego też, od momentu udowodnienia odpowiedniego twierdzenia wymagającego takich założeń, podejmowane były próby ich osła­bienia i próby te najczęściej były skuteczne. Dla testu t-Studenta, Satterthwaite w 1946 roku i Welch w 1947 zaproponowali metody modyfikacji liczby stop­ni swobody statystyki t-Studenta i umożliwiło to stosowanie tego testu nawet wówczas, gdy wariancje w grupach nie były jednorodne. Podobna sytuacja mia­ła miejsce w jednoczynnikowej analizie wariancji. Zamiast przy porównywaniu kilku średnich korzystać ze statystyki F-Snedecora o pełnej liczbie stopni swo­body dla mianownika, w przypadku niejednorodności wariancji w grupach, korzystamy z testów Welcha i Browna-Forsythea. W testach tych dokonano modyfikacji liczby stopni swobody mianownika w statystyce F-Snedecora. I założenie jednorodności wariancji w grupach przestało być ograniczeniem. W dwuczynnikowej analizie wariancji z powtarzaniem obserwacji (dwuczynni­kowej analizie wariancji dla zmiennych zależnych) także stosowane były pew­ne modyfikacje zmieniające liczbę stopni swobody w statystyce F-Snedecora. Modyfikacje te, zaproponowane przez Huynha i Feldta oraz Geissera i Green- housea umożliwiły wykorzystywanie statystyki F-Snedecora w przypadku braku sferyczności macierzy wariancji-kowariancji.

Pojęcie odporności

Poszukując rozwiązań w przypadkach, gdy niespełnione są podstawowe za­łożenia stosowalności określonego testu statystycznego lub metody estyma­cji, Czytelnik napotka pojęcie odporności (robustness, robust testing, robust estimation, robust statistics, robust inference). Analogicznie jak w przypadku pojęcia prawdopodobieństwa czy ryzyka, nie powinno się mówić o abstrak­cyjnym pojęciu odporności, lecz zawsze należy określać czego dotyczy odpor­ność stosowanej metody statystycznej.

W literaturze spotykamy się z dwoma aspektami odporności. Jeden to odporność metod statystycznych lub statystyk na pojawiające się tzw. war­tości odstające (outliers) (Ripley, 2004), drugi to odporność tych metod na niespełnianie podstawowych założeń (Hampel, 2000; 2001). Można także  spotkać się z poglądem, że odporność jest pojęciem budzącym poważne wątpliwości (Bradley, 1978), lecz tego ostatniego wątku nie będziemy roz­wijać.

Wartości odstające nie muszą być błędnymi, mogą to być wartości popraw­ne, a fakt, że w tej próbie zostały potraktowane jako odstające może wynikać z dużego rozrzutu badanego parametru. Bardzo często parametry biologiczne charakteryzują się dużą zmiennością. Wartość odstająca powinna, w każdym przypadku, zostać dokładnie sprawdzona, nim zostanie uznana za wartość błędną. Nie powinniśmy zatem zbyt pochopnie usuwać ze zbioru danych wartości odstających, a w praktyce nigdy nie powinniśmy usuwać żadnych obserwacji ze zbioru danych, z wyjątkiem takich, o których wiemy, że są wy­nikiem błędu, np. błędu zapisu (przesunięcie przecinka w liczbie ułamkowej), błędu pomiaru (uszkodzony został instrument pomiarowy), zanieczyszcze­nie materiału biologicznego, świadomego zafałszowania testu psychologicz­nego itp. Mimo swojej merytorycznej poprawności wartości odstające mogą wprowadzać zamęt do standardowych metod statystycznych, dlatego też od lat sześćdziesiątych ubiegłego wieku intensywnie są one modyfikowane, by zmniejszyć ich wrażliwość na występowanie wartości odstających. W staty­stycznej literaturze angielskojęzycznej występuje kilka rodzajów odporności, nazywanych: robust, resistant, stable. Różnice nazewnictwa wynikają bardziej z obszaru zastosowań (nauki przyrodnicze, zastosowania inżynierskie, nauki społeczne) niż różnic we właściwościach metod. Problemy te omawia szerzej Erica Jen (2002).

W naszych rozważaniach nie będziemy zajmowali się odpornością metod na wartości odstające, a zajmiemy się drugim rodzajem odporności, tzn. zachowaniem się metod statystycznych, gdy nie są spełnione ich podstawowe założenia. Warto jednakże zauważyć, że występowanie wartości odstających może znie­kształcać postać rozkładu prawdopodobieństwa badanej cechy, zatem nie da się do końca rozdzielić tych dwóch typów odporności. Jeśli w próbie pojawi się kilka wartości bardzo dużych, wpłynie to na wartość współczynnika skośności, co z kolei pociągnie za sobą decyzję, iż rozkład prawdopodobieństwa nie jest rozkładem normalnym. Gdy wartości takie możemy uznać za będące rezulta­tem popełnionego błędu, np. pomiarowego, to ich usunięcie uzdrawia sytuację. W przeciwnym przypadku, gdy wartości odstające są wartościami prawidłowy­mi. mamy do czynienia z rozkładem różnym od normalnego. Z rozważań tych wynika, że nie do końca można rozdzielić odporność na wartości odstające od odporności na niespełnianie podstawowych założeń stosowanej metody staty­stycznej. W badaniach psychologicznych rzadziej sprawiają kłopoty wartości odstające, a większym problemem są teoretyczne założenia stosowanych metod statystycznych.

Stosowanie metod statystycznych do opracowywania wyników badań i wy­ciągania odpowiednich wniosków nazywane bywa wnioskowaniem statystycz­nym. Wnioskowanie statystyczne będziemy traktowali jako odporne, jeśli bę­dzie ono niewrażliwe na (mniejsze albo większe) odchylenia od założeń, przy których było otrzymane.

Tego typu odporność może dotyczyć różnych aspektów wnioskowania, np. postaci rozkładu prawdopodobieństwa statystyki będącej podstawą testu, war­tości tej statystyki, mocy testu, wartości estymatora itp.

Potrzeba stosowania procedur odpornych była zawsze oczywista dla wybit­nych statystyków-praktyków jak Newcomb, Pearson, Gosset („Student”), Jeffreys. Było to przekonująco wykazane przez E.S. Pearsona dla testów i J.W. Tukeya dla estymatorów. Tukey (1960) wykazał brak odporności średniej arytme­tycznej nawet przy nieznacznych odstępstwach od normalności.

Znaczna j część procedur statystycznych, będących dziś w powszechnym użyciu, powstała I przy rozwiązywaniu problemów teoretycznych i praktycznych. Wielu czołowych współtwórców statystyki, łącznie z tymi, którzy wnieśli wkład w jej podstawy  matematyczne, miało w swojej pracy bliski kontakt z analizą danych pochodzących z badań. Z punktu widzenia historycznego, zainteresowanie statystyków zagadnieniem praktycznych zastosowań zdobyczy teoretycznych okazało się bardzo twórcze i takie prawdopodobnie będzie zawsze.”

Cytat tekstu: Wiesław Szymczyk (2010) – Podstawy statystyki dla psychologów. Podręcznik akademicki. wyd. Difin. s. 287.