Hipoteza statystyczna

Hipoteza statystyczna

Hipoteza statystyczna – Obiegowa opinia, że za pomocą statystyki można udowodnić wszystko (choć sąd ten wynika z innych przyczyn, o czym za chwilę), jest zupełną nie­prawdą, gdyż za pomocą metod statystycznych nie jesteśmy w stanie udowodnić prawdziwości jakiejkolwiek hipotezy i nigdy nie udowadniamy prawdziwości czy nieprawdziwości jakiejkolwiek tezy. Stosując statystykę, uzyskujemy wiedzę użyteczną (najczęściej także prawdziwą, choć nie zawsze).

Wracając do powszechnych opinii o statystyce, spotykamy również i takie:

  • statystyka to kłamstwa,
  • znam odpowiedź, dostarcz mi statystyk w celu jej uzasadnienia.

Wynikają one z tego, że istotnie używając niewłaściwych metod, czy wyko­rzystując tylko część i to tendencyjnie wybranych danych albo używając wymy­ślonych danych, możemy dowolnie wpływać na uzyskiwane rezultaty. Ale takie zjawiska występują w każdej dziedzinie ludzkiej działalności (np. statystyka medyczna). Lekarz wybierając niewłaściwy sposób leczenia, może spowodować śmierć pacjenta, piekarz uży­wając niewłaściwej mąki upiecze zakalec. Te same prawa rządzą stosowaniem metod statystycznych. Każda metoda statystyczna ma leżący u jej podstaw zbiór założeń i pewien zakres stosowalności i poza ten zakres nie mamy prawa wyjść, aby nie fałszować rezultatów.

Więcej tego typu rozważań oraz mnóstwo przykładów zastosowań statysty­ki znajdzie czytelnik w książce Rao (1994).

W statystyce matematycznej wyróżniamy dwa główne działy, do których daje się zakwalifikować znakomitą większość wykorzystywanych metod: teoria estymacji i testowanie hipotez statystycznych. Poniżej sformułowane zostaną podstawowe pojęcia z zakresu teorii testowania hipotez statystycznych oraz teorii estymacji. Pojęcia te będą sformułowane w pełnej ogólności, aby można było pokazać istotę statystyki jako problematyki podejmowania decyzji.

Hipoteza statystyczna to każde przypuszczenie dotyczące rozkładu (roz­kładów) prawdopodobieństwa badanej zmiennej losowej (zmiennych losowych). Przypuszczenie to może dotyczyć parametru (parametrów) rozkładu prawdopodobieństwa albo postaci tegoż rozkładu. Hipoteza statystyczna dotyczy teoretycznej kategorii badania, a nie wyni­ków uzyskanych z próby. Hipoteza statystyczna formułowana jest w terminach prawdziwych (choć nam nieznanych) wartości parametrów rozkładu bądź postaci rozkładu prawdopodobieństwa, czyli dotyczy prawdziwych wartości parametrów czy postaci rozkładu, a nie rezultatów uzyskanych na podstawie obserwacji (pomiarów) elementów próby. Wyniki liczbowe uzyskane z próby są podstawą do weryfikacji hipotezy statystycznej. Na podstawie próby, uogól­niając jej wynik, formułujemy pewne sądy dotyczące ogólniejszej rzeczywisto­ści – jest to istota metod indukcyjnych (rozumowania indukcyjnego).

Przykład 1. Hipoteza statystyczna

Porównujemy dwie grupy osób pod względem cechy, którą można mierzyć (masa ciała, wzrost, wskaźnik inteligencji, poziom cholesterolu całkowitego w surowicy krwi itp.). Stawiamy (formułujemy) hipotezę, że wartości oczeki­wane tejże zmiennej są takie same w obu grupach, tj.:

P1= P2

Podkreślam: hipoteza jest sformułowana w terminach „prawdziwych” war­tości parametru, dlatego w sformułowaniu hipotezy występują oznaczenia, jakich używaliśmy dla wartości oczekiwanej. Natomiast sprawdzanie, czyli weryfikację hipotezy, przeprowadza się na podstawie wyników uzyskanych w próbie i parametry obliczane na podstawie próby oznaczane będą inaczej.

Przykład 2. Hipoteza statystyczna

Twierdzimy, że badana przez nas cecha (zmienna losowa) ma rozkład normalny. Ta hipoteza jest sformułowana w terminach postaci funkcyjnej rozkładu praw­dopodobieństwa, ale znów dotyczy ona „prawdziwej zmiennej”, „teoretycznej zmiennej losowej”

Test statystyczny to reguła postępowania, która na podstawie wyników pró­by ma doprowadzić do PODJĘCIA PRZEZ NAS DECYZJI przyjęcia lub od­rzucenia postawionej hipotezy statystycznej. Przyjęcie hipotezy oznacza uzna­nie jej za prawdziwą, natomiast odrzucenie oznacza, iż uznajemy ją za fałszywą. Na podstawie przeprowadzonego testu statystycznego nie jesteśmy w stanie stwierdzić, czy nasza hipoteza statystyczna jest prawdziwa czy fałszywa. Badacz podejmuje decyzję o prawdziwości bądź fałszywości badanej hipotezy, ale jest to jego subiektywna decyzja, która nie musi być poprawna. Na szczęście ta su­biektywna decyzja jest obiektywizowana poprzez ocenę wielkości niepewności, tj. poprzez ocenę prawdopodobieństwa podjęcia decyzji błędnej.