statystyka medyczna, biostatystyka

Zanim prowadzimy nowy lek lub suplement na rynek – analizy statystyczne dla medycyny i farmacji

Analiza statystyczna w farmacji i medycynie.

Wprowadzenie nowego leku lub substancji na rynek jest bardzo trudnym procesem ze względów etycznych i praktycznych.

Wiedza z nauk medycznych i farmaceutycznych tak jak inne gałęzie nauki oraz biznesu jest zobowiązana do wykonania odpowiednich badań i testów przed rozpoczęciem dystrybucji. Zazwyczaj metodologie i badania wykonują labolatoria wyspecjalizowane w danej dziedzinie, ale w celu sprawdzenia wyników przeprowadzonego badania, laby te zanoszą swoje wyniki firmom oferującym obliczenia statystyczne w medycynie i farmacji. Niezależnie kto wykonuje tę analizę to najważniejsze z punktu widzenia analiz statystycznych dla medyków jest zweryfikowanie przyczyn występowania zjawisk medycznych, czyli rezultatów oddziaływania zmiennych na siebie oraz określenie siły tego oddziaływania. W zależności oczywiście od problemu badawczego, choć wydaje się, że to co napisano powyżej jest najczęstszą zagwostką naukowców.

Co się wykonuje w kontekście tego typu przedsięwzięć?

Tak na prawdę jeśli chodzi o statystykę i analizę danych to wykonuje się wszystko. Tzn. potencjalnie można wykonać szereg analiz statystycznych  i weryfikować badane oddziaływanie medyczne. Szczerze powiedziawszy w mojej praktyce spotykam się najczęściej z problemami natury badania zjawiska 0-1 lub pomiarów ilościowych. W przypadku problemów 0-1 najczęściej w statystyce medycznej wykorzystuje się analizy z zakresu klasyfikowania. Do technik analizy tego typu należy model regresji logistycznej lub analizy dykryminacyjnej. Niemniej jednak coraz popularniejsze, przynajmniej w farmacji,  są analizy naiwnym klasyfikatorem Bayesa i analizy skupień. Dzieje się to z pewnego praktycznego powodu. Tego typu analizy statystyczne w medycynie i farmacji są po prostu najczęściej stosowane w publikacjach naukowych z zakresu nauk medycznych, bo są one znane,a badacze posiadają wspólny język statystyczny dzięki któremu mogą swobodnie określać co wyszło a co nie wyszło w teście statystycznym weryfikującym kwestie podejmowane we własnej dziedzinie nauki.

Analiza danych w farmacji i medycynie w swej naturze nie różni się od sposobów obliczenia wyników w innych dziedzinach np. biznesie, psychologii lub ekonomii. Sposób przetwarzania jest taki sam. Dane z pomiarów medycznych są zapisane w wystandaryzowanej jednostce tj. cyfry i symbole. Podlegają one takim samym zasadom do obróbka danych w ryzyku kredytowym lub marketingu produktów. Oczywiście istnieją specyficzne dla prac medycznych i farmakologicznych procedury analityczne lub sposoby analizy, ale biorąc pod uwagę całość pracy statystycznej w tym kontekście to nie różni się ona zbyt mocno od analiz w innych naukach lub sferach biznesu. W każdej dziedzinie musimy wyeksplorować dane, sprawdzić statystyki opisowe, wykresy, braki danych, zwizualizować zależności lub zweryfikować graficznie dynamikę danego zjawiska w czasie (np. przy analizie przeżycia), następnie trzeba wyselekcjonować zmienne poddawane analizie, przekształcić jej w szczególnych przypadkach, zbudować różne modele oraz je porównać między sobą (jeśli istnieje taka możliwość, ale zazwyczaj istnieje, szczególnie w naukowych pracach z zakresu medycyny i farmacji). Każda „dobra” firma statystyczna powinna uporać się z tego typu opracowaniem statystycznym danych medycznych. Warto również skorzystać z dobrych praktyk analitycznych firmy. Niekiedy wypracowane w toku życia działalności gospodarczej i realizacji projektów statystycznych „dobre praktyki” rewelacyjnie sprawdzają się w obszarze prac z zakresu nauk o życiu.

Wracając do tematu. Przed wprowadzeniem czegokolwiek na rynek, warto poddać to odpowiednim badaniom i analizie. W przypadku rozwiązań biznesowych nie ma to takiego wielkiego znaczenia, ale w kontekście leków, farmacji i rozwiązań medycznych ma to ogromne znaczenie. Choćby z tego względu, że ludzie mogą po zażyciu nieprzetestowanych leków się źle czuć, mogą zachorować lub może wyrosnąć im 6 palec u nogi. Oczywiście jedno badanie i jedna analiza statystyczna nie weryfikuje tego, że lek jest dobry. Dopiero seria zweryfikowanych statystycznie i klinicznie badań jest w stanie powiedzieć coś o wielkości działania i sile efektu danego medykamentu.

Replikacja wyników badania i potwierdzenie działania danego efektu jest dowodem zbliżającym badaczy do prawdy naukowej.

statystyka medyczna, biostatystyka

Analiza danych w medycynie – czyli jaką rolę odgrywa Big Data w badaniach nad Parkinsonem.

Analiza danych w medycynie – czyli jaką rolę odgrywa Big Data

Analiza danych w medycynie – czyli jaką rolę odgrywa Big Data w badaniach nad Parkinsonem.

W ostatnich latach, coraz większą popularnością cieszą się urządzenia monitorujące nasze zdrowie. Smartwatche i smartbandy zyskują kolejnych użytkowników, którzy wykorzystują je w celu zbierania informacji na temat stanu swojego zdrowia. Przy ich pomocy możemy zebrać dane np. na temat snu, bądź jeżeli uprawiamy sport, to małe urządzenie na nadgarstku pomoże usystematyzować dane o osiągnięciach i dostarczyć nowych cennych informacji.


Nie trzeba było długo czekać, by znaleźć poważniejsze zastosowanie dla tych technologii. Intel we współpracy z Fundacją Michaela J. Foxa, podjął się badań nad chorobą Parkinsona przy pomocy urządzeń typu „wearables”. Odzież technologiczna jest w stanie dyskretnie zbierać i przekazywać obiektywne dane empiryczne w czasie rzeczywistym, 24 godziny na dobę, siedem dni w tygodniu. Jest to duży postęp w diagnozowaniu i leczeniu Parkinsona. Dzięki zastosowaniu sensorów badacze pozyskają ogrom danych do analizy Big Daty. Nie trudno się domyślić, że w porównaniu z dotychczas stosowanymi metodami monitorowania przebiegu choroby u pacjenta, przeskok w ilości danych będzie ogromny. Jednakże dopiero taka masa danych dostarczy badaczom materiał, na podstawie którego będą w stanie zgłębić istotę problemu choroby Parkinsona i wykryć wzorce. Big Data odgrywa w tym kluczową rolę.


Ze względu na obszerność danych Intel opracował platformę analityczną do big data, która wykorzystuje różne rodzaje oprogramowania, w tym Cloudera CDH — platformę open source, która gromadzi i przechowuje dane oraz nimi zarządza.  Platforma big data obsługuje aplikację analityczną do przetwarzania oraz wykrywania zmian w danych w czasie rzeczywistym. Poprzez wykrywanie anomalii i zmiany w czujniku, może dostarczyć naukowcom obiektywną metodę pomiaru progresji choroby. Zaawansowane możliwości analizy danych udostępnione przez Big data Intel z pewnością okażą się pomocne w dalszych badaniach nad chorobą.


statystyczna analiza przeżycia kaplana mayera krzywe życia analiza danych medycznych

Informacje o statystycznej analizie przeżycia. Techniki obliczeniowe w biostatystyce.

meto

Analiza przeżycia

Informacje ogólne

Te techniki były pierwotnie rozwijane w medycznych i biologicznych badaniach (biostatystyka), ale mają też szerokie zastosowanie w naukach społecznych i ekonomicznych, tak samo jak w inżynierii (rzetelność i analiza przeżycia).

Wyobraź sobie, że jesteś badaczem w szpitalu, który sprawdza efektywność nowego leku na nieuleczalną chorobę. Główną interesującą nas zmienną jest liczba dni, którą przeżyją poszczególni pacjenci. Zasadniczo, można użyć standardowej parametrycznej i nieparametrycznej statystyki by opisać przeciętną długość przetrwania, i aby porównać nowy lek z poprzednimi metodami. Jednakże, na koniec badania, znajdą się pacjenci którzy przetrwali przez cały okres, szczególnie pośród tych, których przyjęto do szpitala (i projektu badawczego) w późnym momencie badania; będą też pacjenci z którymi stracimy kontakt. Zapewne nikt nie będzie chciał ich wykluczyć z badania uznając ich za brak danych (jako, że większość z nich przetrwała i dlatego są odzwierciedleniem sukcesu nowej metody badawczej). Te obserwacje, które zawierają jedynie częściowe informacje nazywa się obserwacjami uciętymi (np. „pacjent A przetrwał przynajmniej 4 miesiące zanim go przeniesiono i straciliśmy z nim kontakt”, określenie ucinania zostało po raz pierwszy użyte przez Halda w 1949).

Obserwacje ucięte

Generalnie, obserwacje ucięte pojawiają się gdy nasza zmienna zależna reprezentuje czas do śmierci klinicznej, i kiedy czas trwania badania jest ograniczony. Obserwacje ucięte mogą w różnych obszarach badania. Na przykład, w badaniach społecznych można sprawdzać „przeżywalność” małżeństw, oceny w momencie bycia wyrzucanym ze szkoły, zwolnienia w korporacjach itd. W każdym przypadku, pod koniec badania, niektóre pary pozostaną małżeństwem, niektórzy nie zostaną wyrzuceni ze szkoły, albo będą ciągle pracować w korporacji; zatem te przypadki są reprezentowane przez obserwacje ucięte.

W ekonomii można zbadać „przeżywalność” nowych biznesów albo okres używalności produktów takich jak pojazdy. W badaniu kontroli jakości, częstą praktyką jest sprawdzanie żywotności części pod obciążeniami (analiza żywotności)

Techniki analityczne

Głównie, metody oferowane przez Analizę przetrwania dotykają tych samych pytań badawczych co wiele innych procedur; jednakże, wszystkie metody a Analizie przetrwania poradzą sobie z obserwacjami uciętymi. Tablice trwania życia, rozkład przeżycia, estymacja funkcji przeżycia to wszystko opisowe metody by oszacować rozkład przeżycia czasów z próbki. Niektóre techniki są zdolne do porównywania przeżywalności w dwóch lub więcej grupach. W końcu, analiza przeżycia oferuje kilka modeli regresji by oszacować związek zmiennych ciągłych z czasami przeżycia.

Tablice trwania życia

Najbardziej bezpośrednim sposobem by opisać przeżywalność w próbce jest obliczenie tablic trwania życia. Jest to jedna ze starszych metod służących do analizy przeżywalności danych. Ta tablica może być uważana za „poszerzony” rozkład częstości. Rozkład czasów przeżycia jest podzielony na pewną liczbę przedziałów. Na każdy przedział możemy obliczyć liczbę i proporcję przypadków albo obiektów, które weszły w poszczególny przedział „żywe”, liczbę i proporcje przypadków, które zniszczyły się w poszczególnym przedziale (np. liczba zdarzeń krańcowych, albo przypadków, które „zmarły”), i liczbę przypadków, które zaginęły albo zostały ucięte w poszczególnym interwale.

Bazując na tych liczbach i proporcjach, można obliczyć kilka dodatkowych statystyk:

Liczba przypadków ryzyka – jest to liczba przypadków, które mieszczą się w poszczególnym przedziale żywych, odjąć połowę przypadków straconych lub uciętych w poszczególnym przedziale.

Proporcja porażek – ta proporcja jest wyliczana jako stosunek liczby przypadków zniszczonych w poszczególnym przedziale, dzielonych przez liczbę przypadków ryzyka w tym przedziale.

Proporcja przeżyć – ta proporcja jest liczona jako 1 odjąć proporcję porażek

Łączna proporcja przetrwania (funkcja przeżycia) – jest to łączna proporcja przypadków potrafiących przeżyć aż do odpowiedniego przedziału. Jako że prawdopodobieństwa przetrwania są przypuszczalnie niezależne pomiędzy przedziałami, to prawdopodobieństwo jest wyliczane przez dzielenie prawdopodobieństw pomiędzy wszystkimi poprzednimi przedziałami. Powstająca funkcja jest także zwana przeżywalnością lub funkcją przeżycia.

Prawdopodobieństwo zawartości – jest to oszacowane prawdopodobieństwo porażki w poszczególnym przedziale, obliczone w jednostce czasu, czyli:

Fi = (Pi-Pi+1) /hi

W tym wzorze, Fi jest danym prawdopodobieństwem zawartości w przedziale i, Pi jest oszacowaną łączną proporcją przeżycia na początku przedziału i (na końcu przedziału i-1), Pi+1 jest łączną proporcją przeżycia na końcu przedziału i, a hi jest szerokością danego przedziału.

Stawka ryzyka – stawka ryzyka jest definiowana prawdopodobieństwo w jednostce czasu, że przypadek, który przeżył do początku danego przedziału zginą w tym przedziale. Dokładniej rzecz biorąc, jest wyliczane jako liczba zniszczonych w jednostkach czasu w danym przedziale, podzielona przez średnią liczbę żyjących przypadków w środku przedziału.

Średni czas przeżycia – jest to czas przeżycia, w którym łączna funkcja przeżycia wynosi 0,5. Inne percentyle (25, 75) z łącznej funkcji przeżycia mogą być obliczane równolegle. Zauważ, że percentyl 50 (średni) dla łącznej funkcji przeżycia zwykle nie jest taki sam jak punkt w czasie gdzie przeżywa 50% próbki (tak byłoby tylko w przypadku gdzie nie wystąpiłyby obserwacje ucięte).

Wymagana wielkość próbki – aby polegać na wiarygodnych oszacowaniach z tych 3 najważniejszych funkcji (przeżywalność, prawdopodobieństwo zawartości i ryzyko) i ich typowe błędy za każdym razem minimalna rekomendowana wielkość próbki wynosi 30.

analiza statystyczna, analizy statystyczne, pomoc statystyczna, usługi statystyczne

Biostatystyka – analiza statystyczna danych w medycynie.

Statystyka w medycynie

Rozwinęła się na tyle i przyjęła swoją własną nomenklaturę, że naukowcy zaczęli ją traktować jako bardzo specyficzną dziedzinę i dali jej nazwę jaką jest biostatystyka. To właśnie w tym pojęciu  zawiera się wszystko co jest jednym z etapów opracowywania raportu podsumowującego wykonane badania z zakresu medycyny.

Biostatystyka zamiennie nazywana również biometrią jest to obszar nauk o życiu i zdrowiu oraz statystyki. Jest to zastosowanie metod statystycznych w kontekście projektów naukowych w medycynie, weterynarii, pielęgniarstwie, genetyce i rolnictwie. Statystykę medyczną stosuję się głównie w badaniach obserwacyjnych, badaniach dotyczących skuteczności leków i badaniach klinicznych (weryfikacja czasu trwania życia pacjentów). Dowodzenie badawcze związane z biostatystyką jest głównie związane z metodologią badań medycznych i biologicznych. Do metod tych należy budowa wskaźników, agregowanie danych i analiza statystyczna (najczęściej są to wielowymiarowe modele wyjaśniające lub klasyfikujące) danych zebranych w badaniach, wnioskowanie z tych danych i formułowanie badawczego raportu statystycznego  prawidłowej dyskusji. Głównie biostatystykę stosuje się w zdrowiu publicznym np. w badaniach dotyczących promocji zdrowia oraz w konstrukcji badań klinicystycznych w naukach medycznych. Biostatystyka ma również zastosowanie w ekologii, mianowicie wykorzystuje się ją w przewidywaniu zmian ekosystemowych.

Biostatystyka i Metodolog.pl

Metodolog ma ogromne doświadczenie w analizie danych medycznych (szczególnie z zakresu kardiologii. Jeśli jesteś niepewny co zrobić z danymi lub chcesz sam przeprowadzić analizę skontaktuj się z nami. To nic nie kosztuje, a może nasza pomoc okaże się bardzo skuteczna i szybka. Poważne projekty z zakresu medycyny wymagają bardzo szczegółowego omówienia i zapoznania się z nimi. Jeśli jesteś chętny do skorzystania z usług statystycznych, które oferujemy. Warto aby bardzo zrozumiale przygotować brief celu analizy, opis problemu do rozwiązania lub rozdzielić pracę analityczną na kilka mniejszych etapów. W każdym razie zespół analityków w metodolog jest gotowy do działania z danymi wymagającymi użycia biostatystyki i udzielenia sugestii w kwestii statystyczno metodologicznych.

Biostatystyka statystyka medyczna analizy statystyczne metodolog.pl