Czym jest testowanie hipotezy? Podstawy metodologii badań naukowych

meto

Czym jest testowanie hipotezy?

 

Statystyczna hipoteza jest założeniem o parametrze populacji. To założenie może się okazać prawdziwe lub nie. Testowanie hipotezy odnosi się do formalnych procedur używanych przez statystyków by przyjąć albo odrzucić hipotezę statystyczną.

Hipotezy statystyczne

 

Najlepszym sposobem aby ustalić czy hipoteza statystyczna jest prawdziwa, byłoby przebadanie całej populacji. Jako, że jednak jest to często niepraktyczne, badacze zazwyczaj badają losową próbkę z populacji. Jeżeli próbka nie potwierdza hipotezy, wtedy hipoteza zostaje odrzucona.

Mamy dwa typy hipotez statystycznych:

  • Hipoteza zerowa – oznaczana jako H0, jest zwykle hipotezą, gdzie wyniki z próbek obserwacyjnych wynikają z czystego przypadku.
  • Hipoteza alternatywna – oznaczano jako H1, jest hipotezą, gdzie wyniki z próbek obserwacyjnych są zdefiniowane przez jakąś nielosową przyczynę.

Na przykład, załóżmy, że chcieliśmy ustalić czy moneta jest sprawiedliwa i dobrze wyważona. Hipoteza zerowa mogłaby być taka, że połowa rzutów skończy się orłem, a połowa reszką. Alternatywną hipotezą mogłoby być to, że liczba orłów i reszek będzie różna. W sposób symboliczny, możemy to zapisać następująco:

H0: P = 0.5

H1: P ≠ 0.5

Załóżmy, że rzuciliśmy monetą 50 razy i otrzymaliśmy 40 orłów i 10 reszek. Po otrzymaniu takiego wyniku, będziemy skłonni odrzucić hipotezę zerową. Moglibyśmy wywnioskować, bazując na dowodach, że moneta prawdopodobnie jest niesprawiedliwa i źle wyważona.

Czy możemy przyjąć hipotezę zerową?

Niektórzy badacze mówią, że sprawdzanie hipotez może mieć jeden z dwóch efektów: przyjmujemy hipotezę zerową albo ją odrzucamy. Wielu statystyków, jednakże, kwestionuje pojęcie „przyjęcia hipotezy zerowej”. Zamiast tego, mówią, że odrzuciłeś hipotezę zerową albo nie udało ci się odrzucić hipotezy zerowej.

Jaka jest różnica pomiędzy „przyjąć”, a „nie udało się odrzucić”? Przyjęcie sugeruje, że hipoteza zerowa jest prawdziwa. Nieudane odrzucenie sugeruje, że dane nie są dostatecznie przekonujące dla nas by przedłożyć hipotezę alternatywną ponad hipotezą zerową.

Testowanie hipotez

 

Statystycy idą według formalnych procesów by ustalić czy należy odrzucić hipotezę zerową, opartą na próbce danych. Ten proces, zwany testowaniem hipotez, składa się z czterech kroków:

  • Postawienie hipotez. W nim zawiera się postawienie hipotezy zerowej i alternatywnej. Hipotezy są stawiane w taki sposób aby się wzajemnie wykluczały. To znaczy, że jeśli jedna jest prawdziwa, to druga musi być fałszywa.
  • Sformułowanie planu analizy. Plan analizy opisuje jak użyć próbki danych do oceny hipotezy zerowej. Ocena często skupia się wokół pojedynczej statystyki testowej.
  • Analiza próbki danych. Znalezienie wartości statystyki testowej (średni wynik, proporcje, wynik-t, wynik-z, itd.) opisane w planie analizy.
  • Interpretacja wyników. Zastosowanie zasady decyzyjnej opisanej w palnie analizy. Jeżeli wartość statystki testowej, bazująca na hipotezie zerowej, jest nieprawdopodobna, wtedy odrzucamy hipotezę zerową.

Błędy decyzyjne

 

Z testowania hipotez mogą wyniknąć dwa błędy:

  • Błąd 1 typu – występuje wtedy gdy badacz odrzuca hipotezę zerową, chociaż jest prawdziwa. Prawdopodobieństwo popełnienia błędu 1 typu nazywamy poziomem istotności. To prawdopodobieństwo jest również zwane alfą, i często zapisywane jako α.
  • Błąd 2 typu – występuje kiedy badacz nie odrzuca hipotezy zerowej chociaż jest nieprawdziwa. Prawdopodobieństwo popełnienia błędu 2 typu nazywamy Betą, która jest często oznaczana przez β. Prawdopodobieństwo niepopełnienia błędu 2 typu jest nazywane mocą testu.

Zasady decyzyjności

 

Plan analizy zawiera zasady decyzyjności dla odrzucania hipotez zerowych. W praktyce, statystycy opisują te zasady decyzyjności na dwa sposoby – w odniesieniu do wartości P albo w odniesieniu do przedziału ufności.

  • Wartość P – mierzy siłę dowodów wspierających hipotezę zerową. Załóżmy, że statystyka testu wynosi Wartość P jest prawdopodobieństwem zaobserwowania statystyki testu tak skrajnej jak S, zakładając prawdziwą hipotezę zerową. Jeżeli P wynosi mniej niż poziom istotności, wtedy odrzucamy hipotezę zerową.
  • Przedział ufności – jest zakresem wartości. Jeżeli statystyka testu mieści się w przedziale ufności, hipoteza zerowa nie jest odrzucona. Przedział ufności jest tak definiowany aby szansa popełnienia błędu 1 typu była tożsama z poziomem istotności.

Zestaw wartości poza przedziałem ufności nazywamy obszarem krytycznym. Jeżeli statystyka testu mieści się w obszarze krytycznym, hipoteza zerowa zostaje odrzucona. W takich przypadkach, mówimy że hipotezy zostały odrzucone na poziomie istotności α.

Te podejścia są równoważne. Niektóre testy statystyczne używają wartości P, inne przedziału ufności. W kolejnych częściach, ten tutorial zaprezentuje przykłady obrazujące każde z tych podejść.

Testy jednostronne i dwustronne

 

Test statystycznej hipotezy, gdzie obszar krytyczny jest tylko po jednej stronie rozkładu próbki, jest nazywany testem jednostronnym. Na przykład, załóżmy, że hipoteza zerowa stanowi, że średnia jest mniejsza albo równa 10. Alternatywna hipoteza byłaby taka, że średnia jest większa od 10. Obszar krytyczny składałby się z zakresu numerów znajdujących się na prawo od rozkładu próbki, czyli z zestawu numerów większych od 10.