statystyczna analiza przeżycia kaplana mayera krzywe życia analiza danych medycznych

Informacje o statystycznej analizie przeżycia. Techniki obliczeniowe w biostatystyce.

meto

Analiza przeżycia

Informacje ogólne

Te techniki były pierwotnie rozwijane w medycznych i biologicznych badaniach (biostatystyka), ale mają też szerokie zastosowanie w naukach społecznych i ekonomicznych, tak samo jak w inżynierii (rzetelność i analiza przeżycia).

Wyobraź sobie, że jesteś badaczem w szpitalu, który sprawdza efektywność nowego leku na nieuleczalną chorobę. Główną interesującą nas zmienną jest liczba dni, którą przeżyją poszczególni pacjenci. Zasadniczo, można użyć standardowej parametrycznej i nieparametrycznej statystyki by opisać przeciętną długość przetrwania, i aby porównać nowy lek z poprzednimi metodami. Jednakże, na koniec badania, znajdą się pacjenci którzy przetrwali przez cały okres, szczególnie pośród tych, których przyjęto do szpitala (i projektu badawczego) w późnym momencie badania; będą też pacjenci z którymi stracimy kontakt. Zapewne nikt nie będzie chciał ich wykluczyć z badania uznając ich za brak danych (jako, że większość z nich przetrwała i dlatego są odzwierciedleniem sukcesu nowej metody badawczej). Te obserwacje, które zawierają jedynie częściowe informacje nazywa się obserwacjami uciętymi (np. „pacjent A przetrwał przynajmniej 4 miesiące zanim go przeniesiono i straciliśmy z nim kontakt”, określenie ucinania zostało po raz pierwszy użyte przez Halda w 1949).

Obserwacje ucięte

Generalnie, obserwacje ucięte pojawiają się gdy nasza zmienna zależna reprezentuje czas do śmierci klinicznej, i kiedy czas trwania badania jest ograniczony. Obserwacje ucięte mogą w różnych obszarach badania. Na przykład, w badaniach społecznych można sprawdzać „przeżywalność” małżeństw, oceny w momencie bycia wyrzucanym ze szkoły, zwolnienia w korporacjach itd. W każdym przypadku, pod koniec badania, niektóre pary pozostaną małżeństwem, niektórzy nie zostaną wyrzuceni ze szkoły, albo będą ciągle pracować w korporacji; zatem te przypadki są reprezentowane przez obserwacje ucięte.

W ekonomii można zbadać „przeżywalność” nowych biznesów albo okres używalności produktów takich jak pojazdy. W badaniu kontroli jakości, częstą praktyką jest sprawdzanie żywotności części pod obciążeniami (analiza żywotności)

Techniki analityczne

Głównie, metody oferowane przez Analizę przetrwania dotykają tych samych pytań badawczych co wiele innych procedur; jednakże, wszystkie metody a Analizie przetrwania poradzą sobie z obserwacjami uciętymi. Tablice trwania życia, rozkład przeżycia, estymacja funkcji przeżycia to wszystko opisowe metody by oszacować rozkład przeżycia czasów z próbki. Niektóre techniki są zdolne do porównywania przeżywalności w dwóch lub więcej grupach. W końcu, analiza przeżycia oferuje kilka modeli regresji by oszacować związek zmiennych ciągłych z czasami przeżycia.

Tablice trwania życia

Najbardziej bezpośrednim sposobem by opisać przeżywalność w próbce jest obliczenie tablic trwania życia. Jest to jedna ze starszych metod służących do analizy przeżywalności danych. Ta tablica może być uważana za „poszerzony” rozkład częstości. Rozkład czasów przeżycia jest podzielony na pewną liczbę przedziałów. Na każdy przedział możemy obliczyć liczbę i proporcję przypadków albo obiektów, które weszły w poszczególny przedział „żywe”, liczbę i proporcje przypadków, które zniszczyły się w poszczególnym przedziale (np. liczba zdarzeń krańcowych, albo przypadków, które „zmarły”), i liczbę przypadków, które zaginęły albo zostały ucięte w poszczególnym interwale.

Bazując na tych liczbach i proporcjach, można obliczyć kilka dodatkowych statystyk:

Liczba przypadków ryzyka – jest to liczba przypadków, które mieszczą się w poszczególnym przedziale żywych, odjąć połowę przypadków straconych lub uciętych w poszczególnym przedziale.

Proporcja porażek – ta proporcja jest wyliczana jako stosunek liczby przypadków zniszczonych w poszczególnym przedziale, dzielonych przez liczbę przypadków ryzyka w tym przedziale.

Proporcja przeżyć – ta proporcja jest liczona jako 1 odjąć proporcję porażek

Łączna proporcja przetrwania (funkcja przeżycia) – jest to łączna proporcja przypadków potrafiących przeżyć aż do odpowiedniego przedziału. Jako że prawdopodobieństwa przetrwania są przypuszczalnie niezależne pomiędzy przedziałami, to prawdopodobieństwo jest wyliczane przez dzielenie prawdopodobieństw pomiędzy wszystkimi poprzednimi przedziałami. Powstająca funkcja jest także zwana przeżywalnością lub funkcją przeżycia.

Prawdopodobieństwo zawartości – jest to oszacowane prawdopodobieństwo porażki w poszczególnym przedziale, obliczone w jednostce czasu, czyli:

Fi = (Pi-Pi+1) /hi

W tym wzorze, Fi jest danym prawdopodobieństwem zawartości w przedziale i, Pi jest oszacowaną łączną proporcją przeżycia na początku przedziału i (na końcu przedziału i-1), Pi+1 jest łączną proporcją przeżycia na końcu przedziału i, a hi jest szerokością danego przedziału.

Stawka ryzyka – stawka ryzyka jest definiowana prawdopodobieństwo w jednostce czasu, że przypadek, który przeżył do początku danego przedziału zginą w tym przedziale. Dokładniej rzecz biorąc, jest wyliczane jako liczba zniszczonych w jednostkach czasu w danym przedziale, podzielona przez średnią liczbę żyjących przypadków w środku przedziału.

Średni czas przeżycia – jest to czas przeżycia, w którym łączna funkcja przeżycia wynosi 0,5. Inne percentyle (25, 75) z łącznej funkcji przeżycia mogą być obliczane równolegle. Zauważ, że percentyl 50 (średni) dla łącznej funkcji przeżycia zwykle nie jest taki sam jak punkt w czasie gdzie przeżywa 50% próbki (tak byłoby tylko w przypadku gdzie nie wystąpiłyby obserwacje ucięte).

Wymagana wielkość próbki – aby polegać na wiarygodnych oszacowaniach z tych 3 najważniejszych funkcji (przeżywalność, prawdopodobieństwo zawartości i ryzyko) i ich typowe błędy za każdym razem minimalna rekomendowana wielkość próbki wynosi 30.

ryzyko kredytowe analiza statystyczna ryzyka kredytowego

Budowa ankiet on – line oraz badanie ankietowe i jego analiza statystyczna.

 

Budowa ankiet on line, przeprowadzenie badania ankietowego oraz analiza statystyczna zebranych wyników.

W swojej ofercie Metodolog ma dla Was możliwość utworzenia formularza ankietowego w zaawansowanej formie jaką jest ankieta on – line w systemie Lime (Ponad to jesteśmy w stanie przeprowadzić badanie ankietowe) Lime jest badawczym kombajnem jeśli chodzi o możliwości badawcze. Dla przykładu możemy dzięki takiej ankiecie zbierać informacje na pytania jakościowe oraz pytania z różnorodną skalą odpowiedzi, ponad to możemy prosić badanych o umieszczenie pliku np. ze zdjęciem, dźwiękiem lub czymkolwiek, możemy prosić badanych o wskazanie swojego miejsca położenia na mapie. W najnowszej edycji ów oprogramowania do tworzenia internetowych badań jest możliwość podłączenia pod ankietę systemu Google Analitics przez co możemy śledzić naszą ankietę poprzez wgląd w geolokalizację.

Ankiety on line (badania ankietowe) są wygodną formą przeprowadzania badań szczególnie w dziedzinie psychologii, a konkretnie w psychometrii, gdzie ilość badanych obserwacji przekłada się na jakość oszacowań wynikających z dokładności pomiarowej badanych skal oraz zróżnicowanie wyników.

Oczywiście są pewne ograniczenia i dodatkowe błędy wynikające z testowania on – line. Niemniej jednak tego typu ankieta oraz możliwość badania bardzo różnorodnych prób badawczych daje wielkie pole do badań. Prawdopodobnie wraz ze wzrostem popularności testowania on – line będą opracowywane specjalne metodologie pozwalające na zminimalizowanie błędów wynikających z różnorodności warunków w których odbywa się zbieranie danych od internautów.

Bardzo wielką korzyścią przy korzystaniu z systemów ankiet internetowych jest to, że badacz może zaoszczędzić czas na wpisywaniu wyników z ankiet do bazy danych. W przypadku systemów informatycznych oferujących badania internetowe (w tym używany przez Metodolog system Lime) jest możliwość eksportu bazy danych z serwera do wielu formatów baz danych takich jak xls, txt, tab, sav, xlsx itp. Takie rozwiązanie oszczędza czas i nerwy 🙂

Po zebraniu wyników przez system internetowej ankiety może je poddawać analizie statystycznej. Niektóre systemy ankietowe posiadają w swym potencjale podstawowe analizy statystyczne i algorytmy liczące wyniki zebranych danych w internecie. Niemniej jednak statystyki te i testy statystyczne są mało zaawansowane. Choć bardzo to pomaga na etapie linkowania ankiety. Badacz może zaglądać do wyników i strategicznie planować rozmieszczenie linków i dobór obserwacji do badania.

Z całego serca polecamy możliwość badania ankietowego on line w Metodologu przy czym oferujemy oczywiście statystyczną (mniej lub bardziej zaawansowaną) analizę danych z ów ankiety.

Oczywiście, przestrzegamy przed projektowaniem ankiety internetowej samemu. Narzędzia do badań on line mają ogromy potencjał (nieznany większości) i dzięki temu cennemu aspektowi można zebrać o wiele więcej cennych danych widzianych z perspektywy badawczo naukowej.


Autorem tekstu jest Konrad Hryniewicz

cv

Analiza koszykowa / asocjacji algorytm apriori. Lepiej odpowiadać na potrzeby innych niż narzucać im swoją wolę.

 

 

Wsparcie i ufność dzięki algorytmowi Apriori ( analiza koszykowa ).

 

analiza conjoint, analiza danych w marketingu, analiza statystyczna w marketingu, analiza użyteczności, badania, badania marketingowe, Badanie, dane marketingowe, decyzje konsumenckie, decyzje zakupowe, marketing, marketingu, pomoc statystyczna, raport statystyczny w marketingu, statystyczna analiza preferencji, statystyka, statystyka w marketingu, statystyki, usługi statystyczne, użyteczność

 

 

analiza statystyczna metodolog

Skalowanie wielowymiarowe – Mapa percepcji i odległości między obiektami.

Skalowanie wielowymiarowe – Mapa percepcji i odległości między obiektami.

(Multidimensional scaling – MDS) procedura statystyczna mająca na celu wykrycie zmiennych nieobserwowalnych które wyjaśniają podobieństwa i różnice między badanymi obiektami. MDS dąży do tego aby w przestrzeni wielowymiarowej obiekty podobne do siebie znajdowały się bliżej, a różne od siebie dalej. Jest to technika wykorzystywana często w rozstrzygania sporów sądowych dotyczących podobieństwa marek. Nieuczciwi przedsiębiorcy wypuszczają w obieg produkt który jest już podobny do znanych marek, co wiąże się z tym że produkt ten wykorzystuje dobroczynne właściwości zdobytej przez konkurencyjną markę opinię konsumentów. Produkt podobny może być mylony przez podobieństwo do oryginalnej marki, przez co producent traci wypracowane zyski. Procedura skalowania wielowymiarowego może badać podobieństwo percepcyjne (tak jak konsumenci widzą markę), emocjonalne (związane uczucia z nią) oraz znaczeniowe ( znaczenia i pojęcia jakimi myślą konsumenci o danej marce). Metodolog używa trzech metodologii zbierania danych do tworzenia map percepcyjnych, pierwszą metodą jest SpAM, drugą Classic (Pairwise), a trzecią Total-Set (Pairwise).

Procedura może wykazać podobieństwa pomiędzy materiałami obrazowymi (zdjęcia, rzeczywiste przedmioty ), abstrakcyjnymi (pojęcia) lub zmysłowymi zapach, dźwięki aukustyczne). Czas realizacji badania jest zależny od  badanych bodźców i wybranej metodologii badawczej. Przy braku presji czasowej możemy przeprowadzić badanie obarczone minimalnym błędem pomiaru co daje możliwość wglądu w rzeczywiste związki pomiędzy badanymi obiektami.

Rysunek nr 1 przedstawia macierz odległości pomiędzy miastami Polskimi i stolicą Niemiec.

Rysunek nr 2 przedstawia podobieństwa pomiędzy zwierzętami.

 Rysunek 3 przedstawia podobieństwo między markami wódek.

Najczęstsze dziedziny wykorzystywania tej metody statystycznej :

Badania naukowe

Badania opinii konsumentów

Podejmowanie decyzji

Spory sądowe

Badania marketingowe w kontekście skojarzeń związanych z markami.

Czas badania:

 Czas zależy od ilości badanych, metody badawczej i porównywanych obiektów. 

Rys 1.

Procedura skalowania wielowymiarowego

Rys nr 2.

skalowanie_wielowymiarowe_analiza_odległości_2 Procedura skalowania wielowymiarowego

Rys nr 3.

 skalowanie_wielowymiarowe_analiza_odległości_3 Procedura skalowania wielowymiarowego