Hipoteza statystyczna
Hipoteza statystyczna – Obiegowa opinia, że za pomocą statystyki można udowodnić wszystko (choć sąd ten wynika z innych przyczyn, o czym za chwilę), jest zupełną nieprawdą, gdyż za pomocą metod statystycznych nie jesteśmy w stanie udowodnić prawdziwości jakiejkolwiek hipotezy i nigdy nie udowadniamy prawdziwości czy nieprawdziwości jakiejkolwiek tezy. Stosując statystykę, uzyskujemy wiedzę użyteczną (najczęściej także prawdziwą, choć nie zawsze).
Wracając do powszechnych opinii o statystyce, spotykamy również i takie:
- statystyka to kłamstwa,
- znam odpowiedź, dostarcz mi statystyk w celu jej uzasadnienia.
Wynikają one z tego, że istotnie używając niewłaściwych metod, czy wykorzystując tylko część i to tendencyjnie wybranych danych albo używając wymyślonych danych, możemy dowolnie wpływać na uzyskiwane rezultaty. Ale takie zjawiska występują w każdej dziedzinie ludzkiej działalności (np. statystyka medyczna). Lekarz wybierając niewłaściwy sposób leczenia, może spowodować śmierć pacjenta, piekarz używając niewłaściwej mąki upiecze zakalec. Te same prawa rządzą stosowaniem metod statystycznych. Każda metoda statystyczna ma leżący u jej podstaw zbiór założeń i pewien zakres stosowalności i poza ten zakres nie mamy prawa wyjść, aby nie fałszować rezultatów.
Więcej tego typu rozważań oraz mnóstwo przykładów zastosowań statystyki znajdzie czytelnik w książce Rao (1994).
W statystyce matematycznej wyróżniamy dwa główne działy, do których daje się zakwalifikować znakomitą większość wykorzystywanych metod: teoria estymacji i testowanie hipotez statystycznych. Poniżej sformułowane zostaną podstawowe pojęcia z zakresu teorii testowania hipotez statystycznych oraz teorii estymacji. Pojęcia te będą sformułowane w pełnej ogólności, aby można było pokazać istotę statystyki jako problematyki podejmowania decyzji.
Hipoteza statystyczna to każde przypuszczenie dotyczące rozkładu (rozkładów) prawdopodobieństwa badanej zmiennej losowej (zmiennych losowych). Przypuszczenie to może dotyczyć parametru (parametrów) rozkładu prawdopodobieństwa albo postaci tegoż rozkładu. Hipoteza statystyczna dotyczy teoretycznej kategorii badania, a nie wyników uzyskanych z próby. Hipoteza statystyczna formułowana jest w terminach prawdziwych (choć nam nieznanych) wartości parametrów rozkładu bądź postaci rozkładu prawdopodobieństwa, czyli dotyczy prawdziwych wartości parametrów czy postaci rozkładu, a nie rezultatów uzyskanych na podstawie obserwacji (pomiarów) elementów próby. Wyniki liczbowe uzyskane z próby są podstawą do weryfikacji hipotezy statystycznej. Na podstawie próby, uogólniając jej wynik, formułujemy pewne sądy dotyczące ogólniejszej rzeczywistości – jest to istota metod indukcyjnych (rozumowania indukcyjnego).
Przykład 1. Hipoteza statystyczna
Porównujemy dwie grupy osób pod względem cechy, którą można mierzyć (masa ciała, wzrost, wskaźnik inteligencji, poziom cholesterolu całkowitego w surowicy krwi itp.). Stawiamy (formułujemy) hipotezę, że wartości oczekiwane tejże zmiennej są takie same w obu grupach, tj.:
P1= P2
Podkreślam: hipoteza jest sformułowana w terminach „prawdziwych” wartości parametru, dlatego w sformułowaniu hipotezy występują oznaczenia, jakich używaliśmy dla wartości oczekiwanej. Natomiast sprawdzanie, czyli weryfikację hipotezy, przeprowadza się na podstawie wyników uzyskanych w próbie i parametry obliczane na podstawie próby oznaczane będą inaczej.
Przykład 2. Hipoteza statystyczna
Twierdzimy, że badana przez nas cecha (zmienna losowa) ma rozkład normalny. Ta hipoteza jest sformułowana w terminach postaci funkcyjnej rozkładu prawdopodobieństwa, ale znów dotyczy ona „prawdziwej zmiennej”, „teoretycznej zmiennej losowej”
Test statystyczny to reguła postępowania, która na podstawie wyników próby ma doprowadzić do PODJĘCIA PRZEZ NAS DECYZJI przyjęcia lub odrzucenia postawionej hipotezy statystycznej. Przyjęcie hipotezy oznacza uznanie jej za prawdziwą, natomiast odrzucenie oznacza, iż uznajemy ją za fałszywą. Na podstawie przeprowadzonego testu statystycznego nie jesteśmy w stanie stwierdzić, czy nasza hipoteza statystyczna jest prawdziwa czy fałszywa. Badacz podejmuje decyzję o prawdziwości bądź fałszywości badanej hipotezy, ale jest to jego subiektywna decyzja, która nie musi być poprawna. Na szczęście ta subiektywna decyzja jest obiektywizowana poprzez ocenę wielkości niepewności, tj. poprzez ocenę prawdopodobieństwa podjęcia decyzji błędnej.