statystyka medyczna, biostatystyka

Analiza danych w medycynie – czyli jaką rolę odgrywa Big Data w badaniach nad Parkinsonem.

Analiza danych w medycynie – czyli jaką rolę odgrywa Big Data

Analiza danych w medycynie – czyli jaką rolę odgrywa Big Data w badaniach nad Parkinsonem.

W ostatnich latach, coraz większą popularnością cieszą się urządzenia monitorujące nasze zdrowie. Smartwatche i smartbandy zyskują kolejnych użytkowników, którzy wykorzystują je w celu zbierania informacji na temat stanu swojego zdrowia. Przy ich pomocy możemy zebrać dane np. na temat snu, bądź jeżeli uprawiamy sport, to małe urządzenie na nadgarstku pomoże usystematyzować dane o osiągnięciach i dostarczyć nowych cennych informacji.


Nie trzeba było długo czekać, by znaleźć poważniejsze zastosowanie dla tych technologii. Intel we współpracy z Fundacją Michaela J. Foxa, podjął się badań nad chorobą Parkinsona przy pomocy urządzeń typu „wearables”. Odzież technologiczna jest w stanie dyskretnie zbierać i przekazywać obiektywne dane empiryczne w czasie rzeczywistym, 24 godziny na dobę, siedem dni w tygodniu. Jest to duży postęp w diagnozowaniu i leczeniu Parkinsona. Dzięki zastosowaniu sensorów badacze pozyskają ogrom danych do analizy Big Daty. Nie trudno się domyślić, że w porównaniu z dotychczas stosowanymi metodami monitorowania przebiegu choroby u pacjenta, przeskok w ilości danych będzie ogromny. Jednakże dopiero taka masa danych dostarczy badaczom materiał, na podstawie którego będą w stanie zgłębić istotę problemu choroby Parkinsona i wykryć wzorce. Big Data odgrywa w tym kluczową rolę.


Ze względu na obszerność danych Intel opracował platformę analityczną do big data, która wykorzystuje różne rodzaje oprogramowania, w tym Cloudera CDH — platformę open source, która gromadzi i przechowuje dane oraz nimi zarządza.  Platforma big data obsługuje aplikację analityczną do przetwarzania oraz wykrywania zmian w danych w czasie rzeczywistym. Poprzez wykrywanie anomalii i zmiany w czujniku, może dostarczyć naukowcom obiektywną metodę pomiaru progresji choroby. Zaawansowane możliwości analizy danych udostępnione przez Big data Intel z pewnością okażą się pomocne w dalszych badaniach nad chorobą.


statystyczna analiza przeżycia kaplana mayera krzywe życia analiza danych medycznych

Informacje o statystycznej analizie przeżycia. Techniki obliczeniowe w biostatystyce.

meto

Analiza przeżycia

Informacje ogólne

Te techniki były pierwotnie rozwijane w medycznych i biologicznych badaniach (biostatystyka), ale mają też szerokie zastosowanie w naukach społecznych i ekonomicznych, tak samo jak w inżynierii (rzetelność i analiza przeżycia).

Wyobraź sobie, że jesteś badaczem w szpitalu, który sprawdza efektywność nowego leku na nieuleczalną chorobę. Główną interesującą nas zmienną jest liczba dni, którą przeżyją poszczególni pacjenci. Zasadniczo, można użyć standardowej parametrycznej i nieparametrycznej statystyki by opisać przeciętną długość przetrwania, i aby porównać nowy lek z poprzednimi metodami. Jednakże, na koniec badania, znajdą się pacjenci którzy przetrwali przez cały okres, szczególnie pośród tych, których przyjęto do szpitala (i projektu badawczego) w późnym momencie badania; będą też pacjenci z którymi stracimy kontakt. Zapewne nikt nie będzie chciał ich wykluczyć z badania uznając ich za brak danych (jako, że większość z nich przetrwała i dlatego są odzwierciedleniem sukcesu nowej metody badawczej). Te obserwacje, które zawierają jedynie częściowe informacje nazywa się obserwacjami uciętymi (np. „pacjent A przetrwał przynajmniej 4 miesiące zanim go przeniesiono i straciliśmy z nim kontakt”, określenie ucinania zostało po raz pierwszy użyte przez Halda w 1949).

Obserwacje ucięte

Generalnie, obserwacje ucięte pojawiają się gdy nasza zmienna zależna reprezentuje czas do śmierci klinicznej, i kiedy czas trwania badania jest ograniczony. Obserwacje ucięte mogą w różnych obszarach badania. Na przykład, w badaniach społecznych można sprawdzać „przeżywalność” małżeństw, oceny w momencie bycia wyrzucanym ze szkoły, zwolnienia w korporacjach itd. W każdym przypadku, pod koniec badania, niektóre pary pozostaną małżeństwem, niektórzy nie zostaną wyrzuceni ze szkoły, albo będą ciągle pracować w korporacji; zatem te przypadki są reprezentowane przez obserwacje ucięte.

W ekonomii można zbadać „przeżywalność” nowych biznesów albo okres używalności produktów takich jak pojazdy. W badaniu kontroli jakości, częstą praktyką jest sprawdzanie żywotności części pod obciążeniami (analiza żywotności)

Techniki analityczne

Głównie, metody oferowane przez Analizę przetrwania dotykają tych samych pytań badawczych co wiele innych procedur; jednakże, wszystkie metody a Analizie przetrwania poradzą sobie z obserwacjami uciętymi. Tablice trwania życia, rozkład przeżycia, estymacja funkcji przeżycia to wszystko opisowe metody by oszacować rozkład przeżycia czasów z próbki. Niektóre techniki są zdolne do porównywania przeżywalności w dwóch lub więcej grupach. W końcu, analiza przeżycia oferuje kilka modeli regresji by oszacować związek zmiennych ciągłych z czasami przeżycia.

Tablice trwania życia

Najbardziej bezpośrednim sposobem by opisać przeżywalność w próbce jest obliczenie tablic trwania życia. Jest to jedna ze starszych metod służących do analizy przeżywalności danych. Ta tablica może być uważana za „poszerzony” rozkład częstości. Rozkład czasów przeżycia jest podzielony na pewną liczbę przedziałów. Na każdy przedział możemy obliczyć liczbę i proporcję przypadków albo obiektów, które weszły w poszczególny przedział „żywe”, liczbę i proporcje przypadków, które zniszczyły się w poszczególnym przedziale (np. liczba zdarzeń krańcowych, albo przypadków, które „zmarły”), i liczbę przypadków, które zaginęły albo zostały ucięte w poszczególnym interwale.

Bazując na tych liczbach i proporcjach, można obliczyć kilka dodatkowych statystyk:

Liczba przypadków ryzyka – jest to liczba przypadków, które mieszczą się w poszczególnym przedziale żywych, odjąć połowę przypadków straconych lub uciętych w poszczególnym przedziale.

Proporcja porażek – ta proporcja jest wyliczana jako stosunek liczby przypadków zniszczonych w poszczególnym przedziale, dzielonych przez liczbę przypadków ryzyka w tym przedziale.

Proporcja przeżyć – ta proporcja jest liczona jako 1 odjąć proporcję porażek

Łączna proporcja przetrwania (funkcja przeżycia) – jest to łączna proporcja przypadków potrafiących przeżyć aż do odpowiedniego przedziału. Jako że prawdopodobieństwa przetrwania są przypuszczalnie niezależne pomiędzy przedziałami, to prawdopodobieństwo jest wyliczane przez dzielenie prawdopodobieństw pomiędzy wszystkimi poprzednimi przedziałami. Powstająca funkcja jest także zwana przeżywalnością lub funkcją przeżycia.

Prawdopodobieństwo zawartości – jest to oszacowane prawdopodobieństwo porażki w poszczególnym przedziale, obliczone w jednostce czasu, czyli:

Fi = (Pi-Pi+1) /hi

W tym wzorze, Fi jest danym prawdopodobieństwem zawartości w przedziale i, Pi jest oszacowaną łączną proporcją przeżycia na początku przedziału i (na końcu przedziału i-1), Pi+1 jest łączną proporcją przeżycia na końcu przedziału i, a hi jest szerokością danego przedziału.

Stawka ryzyka – stawka ryzyka jest definiowana prawdopodobieństwo w jednostce czasu, że przypadek, który przeżył do początku danego przedziału zginą w tym przedziale. Dokładniej rzecz biorąc, jest wyliczane jako liczba zniszczonych w jednostkach czasu w danym przedziale, podzielona przez średnią liczbę żyjących przypadków w środku przedziału.

Średni czas przeżycia – jest to czas przeżycia, w którym łączna funkcja przeżycia wynosi 0,5. Inne percentyle (25, 75) z łącznej funkcji przeżycia mogą być obliczane równolegle. Zauważ, że percentyl 50 (średni) dla łącznej funkcji przeżycia zwykle nie jest taki sam jak punkt w czasie gdzie przeżywa 50% próbki (tak byłoby tylko w przypadku gdzie nie wystąpiłyby obserwacje ucięte).

Wymagana wielkość próbki – aby polegać na wiarygodnych oszacowaniach z tych 3 najważniejszych funkcji (przeżywalność, prawdopodobieństwo zawartości i ryzyko) i ich typowe błędy za każdym razem minimalna rekomendowana wielkość próbki wynosi 30.

Usługi statystyczne, pomoc statystyczna, statystyczna analiza danych

Usługi statystyczne i pomoc statystyczna – Miło i Szybko

Pomoc statystyczna – Metodolog.pl jako doświadczona i profesjonalna firma statystyczna zachęca do skorzystania z oferty realizacji projektów statystycznych i badawczych

Witamy serdecznie w firmie Metodolog.pl. Jest dla nas ogromną przyjemnością, że przeglądasz nasz serwis w celu poszukiwania pomocy statystycznej i realizacji analiz ilościowych do Twojej pracy naukowej i biznesu. Prawdopodobnie masz oczekiwania w stosunku do nas w kontekście obliczenia wyników.

Możesz spokojnie nam zaufać i powierzyć swoje dane. Są one u nas całkowicie bezpieczne, zapewniamy całkowitą anonimowość oraz poufność w kontekście współpracy z nami.

Wykonujemy pomoc statystyczną i prace obliczeniowe i raportowanie wyników z każdej dziedziny nauki i biznesu.

Jeśli coś jest zapisane w postaci symboli lub cyfr to jesteśmy w stanie to analizować bez najmniejszych problemów.

Jeśli chcesz dowiedzieć się więcej, umówić termin realizacji zlecenia to zapraszamy do kontaktu z nami (klik).

Metodolog.pl w kontekście oferty rozwiązań analitycznych

Poniżej przedstawiamy krótką narrację dotyczącą tego co dzieję się w czasie oferowanej przez nas pomocy statystycznej oraz usług statystycznych. Metodolog ma duże doświadczenie i staż w realizacji zleceń statystycznych dlatego chcemy podkreślić na czym polega działalność firmy statystycznej w kontekście projektów naukowych. Zacznijmy od tego, że najczęściej analizy statystyczne są wykonywane w nauce, następnie w biznesie, a na końcu w instytucjach państwowych (choć te z racji dużych budżetów robią na prawdę wspaniałe rzeczy dzięki analizom). Jak możemy się domyślać wszystkie te pola korzystają z ofert firm statystycznych i specjalistów od analizy danych, choć wydaje się to dziwne ze względu na to, że nauka i biznes mają największe pojęcie i potencjał do rozumienia i wykonywania obliczeń w kontekście swojej działalności naukowej lub zarobkowej.

Skąd to zapotrzebowanie na pomoc statystyczną? Może to wynikać ze zbyt wąskich specjalizacji oraz braku czasu do nauki statystyki lub tego (w przypadku firm), że to się po prostu bardziej opłaca (utrzymanie stanowiska eksperta nie należy do tanich). Najczęściej z tego typu ofert korzysta się w większych ośrodkach miejskich takich jak Warszawa, Wrocław, Kraków, Łódź, Poznań, Bydgoszcz, Lublin, Gdańsk, Toruń, Olsztyn. Prawdopodobnie jest tak ze względu na to, że są to miejsca w których jest bardziej rozwinięty świat akademicki oraz obszar gospodarowania firm i przedsiębiorstw. Niemniej trzeba zwrócić uwagę jednak, że większość firm statystycznych realizuje projekty i pomoc statystyczną w całej Polsce na zasadzie pracy on line lub podejmowania delegacji.

Analizy, usługi i pomoc statystyczna

Analizy statystyczne są w dużym stopniu i najczęściej stosowane w projektach naukowych (licencjackich, magisterskich, doktorskich), choć coraz częściej o opracowanie danych upominają się przedsiębiorcy chcący usprawnić działanie swojego biznesu.

Co oferujemy dostarczając usługi statystyczne lub pomoc statystyczną ?

Najczęściej dostarczamy wiedzę i dobre praktyki dotyczące analiz statystycznych w kontekście badań naukowych i przedsięwzięć biznesowych.

Bardzo często pomagamy w problemach metodologicznych na etapie planowania badań.

Co charakteryzuje pomoc i analizy statystyczne robione przez naszych analityków, którzy od wielu lat pracują z metodami obliczeniowymi i wynikami badań?

  • wyniki obliczeń statystycznych są zazwyczaj przedstawione w czytelnym ergonomicznym, logicznym i prostym – w swej strukturze – raporcie zgodnie z najnowszymi wytycznymi APA7 (APA, 2020)
  • zazwyczaj są zaprezentowane graficzne formy przedstawiania wyników (wykresy, tabele, diagramy, grafy)
  • opis najważniejszych procedur dochodzenia do wyników oraz opis i interpretacja kluczowych (z perspektywy stawianych przed weryfikacją hipotez) wyników
  • dostarczane są najwyższej klasy rozwiązania, które są zgodne z postępującą wiedzą o statystyce
  • dołączana jest bibliografia odnosząca się do wykorzystanych metod, technik, przekształceń, rozwiązań, pojęć itp.
Co dostajesz kiedy skorzystasz z tego typu pomocy statystycznej?
  • zazwyczaj są to obliczenia
  • metodologia
  • opis badanej zbiorowości/ obserwacji
  • analizy eksploracyjne
  • analizy zależności/porównania średnich lub – jeśli projekt tego wymaga – specyficznych (odpowiadających danemu problemowi badawczemu np. analiza CONJOINT)  i zaawansowanych analiz statystycznych (np. całych metododologii analitycznych takich jak CRISP DM)
  • interpretacje wyników i wnioski
  • opis i wizualizację
  • wsparcie merytoryczne i miłą obsługę przed, w czasie, a także po wykonaniu pracy
  • DOŻYWOTNIĄ GWARANCJĘ WYKONANEJ PRACY 🙂

Standardem jest, że wykonanie analizy statystycznej nie przekracza 5 dni. Zazwyczaj czas ten wynosi około 3-5-7 dni, a czasem nawet 2 (choć są też projekty które realizujemy kilka miesięcy). To wszystko zależy od projektu, a w szczególności od ilości zmiennych do analizy oraz problemu badawczego.

Każdy projekt jest oceniany indywidualnie i szczegółowo przez co nie jest mniej lub bardziej ważny

Metodolog ma w swojej ofercie różne pomoce statystyczne, a nawet ekspresowe analizy statystyczne. Zazwyczaj tego typu oferty są realizowane stosunkowo szybko i są niewiele droższe niż normalnie. Średni czas oczekiwania na taki raport nie przekracza doby od momentu ustalenia wszystkich szczegółów metodologii badania lub problemu badawczego oraz samej natury analiz statystycznych.

Profesjonalna pomoc i usługi statystyczne są niesamowitą rzeczą dla osób chcących zrobić postęp w nauce lub poprawić funkcjonowanie firmy w jakimś konkretnym obszarze. Zdecydowanie się na rzetelnego dostawcę pomocy i usług w analizie statystycznej jest gwarancją dobrze wydanych pieniędzy i satysfakcji z podejmowanych decyzji i kierunku rozwoju. Tylko dzięki rozwiązaniom opartym na wiedzy i długoletnim doświadczeniu można być pewnym doskonałej jakości wyników analiz i obliczeń.

*Jesteś studentem lub doktorantem? Potrzebujesz pomoc w analizie statystycznej swojego badania lub linii badań? Zobacz co możemy Ci zaoferować.

Zachęcam do kontaktu

mgr Konrad Hryniewicz Metodolog.pl

mgr Konrad Hryniewicz

+ 798 30 95 31

Bibliografia:

B.G. Tabachnick & L.S. Fidell, “Using Multivariate Statistics,” 4th ed. (Allyn & Bacon, Boston, 2001).  SS&H and IPW QA278.T3 2001.

A. Aron and E.N. Aron, “Statistics for Psychology,” (Prentice-Hall, Upper Saddle River, 1994).  SS&H: BF39.A69

H. Motulsky, “Intuitive Biostatistics: A Nonmathematical Guide to Statistical Thinking,” (2nd ed.) (Oxford University Press, 2010)

D.B. Orr, “Fundamentals of Applied Statistics and Surveys,” (Chapman and Hall, New York, 1995).  SS&H: QA276.12.O77

ryzyko kredytowe analiza statystyczna ryzyka kredytowego

Budowa ankiet on – line oraz badanie ankietowe i jego analiza statystyczna.

 

Budowa ankiet on line, przeprowadzenie badania ankietowego oraz analiza statystyczna zebranych wyników.

W swojej ofercie Metodolog ma dla Was możliwość utworzenia formularza ankietowego w zaawansowanej formie jaką jest ankieta on – line w systemie Lime (Ponad to jesteśmy w stanie przeprowadzić badanie ankietowe) Lime jest badawczym kombajnem jeśli chodzi o możliwości badawcze. Dla przykładu możemy dzięki takiej ankiecie zbierać informacje na pytania jakościowe oraz pytania z różnorodną skalą odpowiedzi, ponad to możemy prosić badanych o umieszczenie pliku np. ze zdjęciem, dźwiękiem lub czymkolwiek, możemy prosić badanych o wskazanie swojego miejsca położenia na mapie. W najnowszej edycji ów oprogramowania do tworzenia internetowych badań jest możliwość podłączenia pod ankietę systemu Google Analitics przez co możemy śledzić naszą ankietę poprzez wgląd w geolokalizację.

Ankiety on line (badania ankietowe) są wygodną formą przeprowadzania badań szczególnie w dziedzinie psychologii, a konkretnie w psychometrii, gdzie ilość badanych obserwacji przekłada się na jakość oszacowań wynikających z dokładności pomiarowej badanych skal oraz zróżnicowanie wyników.

Oczywiście są pewne ograniczenia i dodatkowe błędy wynikające z testowania on – line. Niemniej jednak tego typu ankieta oraz możliwość badania bardzo różnorodnych prób badawczych daje wielkie pole do badań. Prawdopodobnie wraz ze wzrostem popularności testowania on – line będą opracowywane specjalne metodologie pozwalające na zminimalizowanie błędów wynikających z różnorodności warunków w których odbywa się zbieranie danych od internautów.

Bardzo wielką korzyścią przy korzystaniu z systemów ankiet internetowych jest to, że badacz może zaoszczędzić czas na wpisywaniu wyników z ankiet do bazy danych. W przypadku systemów informatycznych oferujących badania internetowe (w tym używany przez Metodolog system Lime) jest możliwość eksportu bazy danych z serwera do wielu formatów baz danych takich jak xls, txt, tab, sav, xlsx itp. Takie rozwiązanie oszczędza czas i nerwy 🙂

Po zebraniu wyników przez system internetowej ankiety może je poddawać analizie statystycznej. Niektóre systemy ankietowe posiadają w swym potencjale podstawowe analizy statystyczne i algorytmy liczące wyniki zebranych danych w internecie. Niemniej jednak statystyki te i testy statystyczne są mało zaawansowane. Choć bardzo to pomaga na etapie linkowania ankiety. Badacz może zaglądać do wyników i strategicznie planować rozmieszczenie linków i dobór obserwacji do badania.

Z całego serca polecamy możliwość badania ankietowego on line w Metodologu przy czym oferujemy oczywiście statystyczną (mniej lub bardziej zaawansowaną) analizę danych z ów ankiety.

Oczywiście, przestrzegamy przed projektowaniem ankiety internetowej samemu. Narzędzia do badań on line mają ogromy potencjał (nieznany większości) i dzięki temu cennemu aspektowi można zebrać o wiele więcej cennych danych widzianych z perspektywy badawczo naukowej.


Autorem tekstu jest Konrad Hryniewicz

cv