Statystyka w badaniach medycznych. Problemy i rozwiązania w analizie danych (biostatystyka)

meto

 

Ze statystyką (biostatystyką) w badaniach medycznych mamy do czynienia w momencie stawiania diagnozy algorytmicznej lub w kontekście badawczym.

W przypadku badań dzięki metodom statystycznym możemy szacować czas życia pacjentów, badać pod uwagę czynniki wpływające na występowanie chorób lub weryfikować czas gojenia się raz w zależności od różnych opatrunków. Sytuacji zastosowań modeli statystycznych (i statystyki w ogóle) jest tyle co metodologii i samych badań. Niemniej jednak problemy statystyczne w badaniach medycznych mogą być sklasyfikowane na kilka typów :

  1. Problemy klasyfikacyjne polegające na wyjaśnieniu badanego zjawiska lub maksymalizacji poprawności klasyfikowania obserwacji do grup (np. chory vs zdrowy lub żyje vs zgon). Najczęściej w tych problemach stosuje się regresję logistyczną, regresję Coxa, drzewa decyzyjne lub analizę dyskryminacyjną. Dąży się do wykrycia istotnych wpływów zmiennych niezależnych na badane zjawisko lub maksymalizację poprawności przyporządkowania obserwacji do grup (problem maksymalizacji separacji). Poza samym wykrywaniem znaczących zależności lub wpływów ma się na celu oszacowanie siły wpływu danych czynników na zmienną zależną, a także ocenę stopnia z jakim zjawisko zostało wyjaśnione. Stosuje się do tego miary ilorazu szans (ODDS Ratio), miary B, Cohen D, eta,  Miary R Kwadrat i ich pochodne. W problemach klasyfikacyjnych bazuje się na współczynniku poprawności klasyfikacji i separacji pomiędzy zbiorami (KS distance, test Fishera).
  2. Problemy polegające na przewidywaniu poziomu pewnego parametru. Często w medycynie chce się przewidzieć czas trwania życia pacjentów lub natężenie jakichś wskaźników np. stężenie glukozy we krwi. W tym celu najczęściej stosuje się metody regresyjne lub inne metody statystyczne mogące dokładnie przewidywać prawdopodobny poziom natężenia danego parametru (np. analiza równań strukturalnych, sieć neuronowa, szereg czasowy).
  3. Problemy podlegające weryfikacji. W tym kontekście stosuje się metody mające na celu weryfikacje przewidywań, rozwiązań problemów badawczych lub rozstrzygnięcia dotyczącego prawdziwości hipotezy zerowej. W tych przypadkach stosuje się metody pozwalające kwestionować losowość zaistniałych zdarzeń (podobnie jak w dwóch pierwszych problemach lecz tutaj to znaczenie ma inny charakter). W tym celu wykorzystuje się techniki analizy wariancji lub ich nieparametrycznych odpowiedników. Stosuje się metody sprawdzania związków pomiędzy zmiennymi jak np. korelacja Pearosna lub Spearmana.

Każda z metod przewidujących i klasyfikujących w biostatystyce ma swoje zalety i wady. Ważnym jest aby statystyka medyczna (zwana biostatystyką) była stosowana w odpowiedni sposób w kontekście badań medycznych. Kluczowe jest aby użyta metoda statystyczna odpowiadała celom badawczym i ukazywała badaczowi pożądane przez niego formy oszacowania wyników lub maksymalizowała stopień dopasowania lub klasyfikacji danych. O wielu metodach wykorzystywanych przez specjalistów w biostatyce nie wspomniano w tym wpisie, a to dlatego, że zastosowanie metod statystycznych podlega pewnym zmianom wynikającym głównie z powodów praktycznych i powodów za którymi stoi zwykła moda lub tradycja.