statystyka medyczna, biostatystyka

Cenzurowanie w analizie przeżycia Metodolog.pl

Cenzurowanie w Badaniach Klinicznych: przegląd technik stosowanych w Analizie Przeżycia

 

Wprowadzenie

Medyczne i epidemiologiczne badania zwykle skupiają się na mierzeniu występowania pewnych zdarzeń. Jednakże badania prowadzone z użyciem analizy przeżycia są skierowane ku pomiarom czasu jaki pozostał do zdarzenia albo efektu. Czas pozostały do zdarzenia może różnić się od czasu zdarzenia krańcowego jak śmierć, albo czas do wystąpienia klinicznego punktu końcowego takiego jak cierpienie lub osiągnięcie markera biochemicznego. Badania analizy przeżycia pochodzą z publikacji Johna Graunta „Cotygodniowy bilans umieralności w Londynie”. Pierwsza tablica trwania życia została przygotowana przez Healy’ego. Analiza przeżycia jest także znana jako analiza długości życia, analiza czasu do zdarzenia, analiza wiarygodności zdarzeń historycznych opierająca się na ognisku i nurcie, w których jest używana.  Jednakże, analiza przeżycia jest nękana problemem cenzurowania w projekcie badań klinicznych, które czyni rutynowe metody determinacji centralnej tendencji zbędnymi w wyliczeniach średniego czasu przeżywalności. Obecny esej ma na celu zwięźle zaprezentować różne metody analizy przeżycia używane do szacowania czasu pozostałego do zdarzeń w badaniach opartych na poziomie danych indywidualnego pacjenta w obecności cenzurowania. W drugiej sekcji zwrócimy uwagę na typy cenzurowania napotkanego w badaniach klinicznych, ich rodzaje i potencjalne rozwiązania statystyczne. Techniki analizy przeżycia, założenia i dopasowanie metod do różnych warunków są zilustrowane w sekcjach 4 i 5. Sekcja 5 omawia znaczenie technik w ekstrapolacji oszacowania dalszego trwania życia pochodzących z czasu przekraczającego okres próbny. Na koniec, sekcja 6 przytacza ograniczenia i zalety różnych metod i konkluduje wskazując możliwe przyszłe obszary badań i praktyk dla ekspertów od zdrowia publicznego i związanej z tym ekonomii. Zrecenzowaliśmy artykuły publikowane w PubMed, Science Direct i Ovid wyszukując ich z użyciem „cenzurowanie w badaniach klinicznych”, „analizy przeżycia” i „metody Kaplana-Meiera” jako zwrotów kluczowych. Po pobraniu 213 artykułów, na potrzeby tego tekstu wybraliśmy te koncentrujące się na metodologicznych aspektach. Oryginalne artykuły były okraszone innymi wchodzącymi z nimi w dyskusje, co istotnie ubogaciło metodologię.

Cenzurowanie w Badaniach Klinicznych

Mówi się, że cenzurowanie jest obecne kiedy informacja o czasie rezultatów nie jest dostępna dla każdego uczestnika badania. Mówi się też, że uczestnik jest ocenzurowany gdy informacja o czasie pozostałym do zdarzenie nie jest dostępna ze względu na brak kontynuacji działania albo niewystąpienie rezultatów zdarzenia przed końcem próby.

Ogólnie napotkamy dwa rodzaje klasyfikacji przez cenzurowanie, np. punktowe i interwałowe.

Cenzurowanie punktowe występuje kiedy pomimo ciągłego monitorowania rezultatów zdarzenia, pacjent stracił kontynuacje działań albo zdarzenie nie wystąpiło w czasie trwania badania. Jest to także znane jako cenzurowanie prawostronne, które może być albo cenzurą-końca-badania albo cenzurą-utraty-kontynuacji. Mówi się, że jednostka jest cenzurowana lewostronnie jeżeli pacjent podlegał ryzyku choroby w okresie poprzedzającym rozpoczęcie badania. Jednakże, cenzurowanie lewostronne nie jest zazwyczaj problemem w badaniach klinicznych, jako że punkt startowy jest definiowany przez zdarzenie takie jak przystąpienie pacjenta do badania, randomizacja albo rozpoczęcie procedury leczenia. Jednostki B i C są ocenzurowane prawostronnie, a jednostka F lewostronnie [obrazek poniżej]:

cenzurowanie obserwacji

Cenzurowanie punktowe w badaniu klinicznym

Problem cenzurowania interwałowego powstaje bo czas do zdarzenia może być znany tylko w przedziale czasowym. Ta sytuacja występuje w przypadku gdy oszacowanie monitoringowe jest robione cyklicznie. Jest to zobrazowane na hipotetycznym badaniu zrobionym by ustalić okres inkubacji AIDS po wystąpieniu infekcji HIV [poniżej]. W praktyce, większość badań traktujących o nieterminalnych rezultatach ma cykliczne plany badań i dlatego są cenzurowane interwałowo. Jednakże, jeśli częstotliwość badań ma usprawiedliwioną regularność, interwałowe cenzurowanie danych może być omówione z punktowym cenzurowaniem.

 interwałowe cenzurowanie obserwacji

Interwałowe cenzurowanie w badaniu klinicznym

Statystycy opracowali różne metody by uporać się z cenzurowaniem danych, takie jak całkowita analiza danych, techniki przypisywania albo analizy oparte na dychotomizowanych danych. Jednak te metody są obciążone problemami i poziomem skomplikowania dla innych. Szczegółowa dyskusja o każdej z tych metod jest poza zakresem tego eseju i się w nim nie zmieści, ale warto mieć gdzieś z tyłu głowy, że takie techniki istnieją i są dostępne. Bardziej efektywne metody, które są szeroko używane w badaniach przeżywalności napotykające ocenzurowane dane to oparte na prawdopodobieństwie podejścia (metody analizy przeżycia) które regulują wystąpienie cenzurowania w każdej obserwacji i osiągają przewagę wykorzystując wszystkie dostępne informacje.

Techniki analizy przeżycia

Techniki analizy przeżycia wykorzystywane do rozwiązywania problemów z ocenzurowanymi danymi mogą być najogólniej podzielone na nieparametryczne (estymator Kaplana-Meiera), parametryczne (Wiebull i metody wykładnicze) i semi-parametryczne (model proporcjonalnego hazardu Coxa). Ostatnie dwa mogą być także użyte jako bazujące na regresji modele. Jednakże, zwykłe oparte na prawdopodobieństwie funkcje z całej próbki, które są produktem jednostkowego prawdopodobieństwa funkcji nie mogą być zastosowane w obecności kompleksowych mechanizmów cenzurujących, zwłaszcza w obecności obu, przerwy w działaniach i zakończenia badania. W takiej sytuacji może zostać wykonana połączona rozkład czasów przeżycia i ocenzurowanych. Jednakże, rozkład czasów przeżycia w takiej sytuacji jest uznawana za nierozpoznawalną. Co za tym idzie, założenie o niezależnym cenzurowaniu jest imperatywne. To założenie implikuje, że czasy do ocenzurowania i przeżycia okresów są niezależne. Innymi słowy, cenzurowanie jest niezależne od niezwykle wysokiego albo niskiego ryzyka wystąpienia zdarzenia, co oznacza, że czas przeżycia dla ocenzurowanych i nieocenzurowanych jednostek jest taki sam i usunięcie ocenzurowanych jednostek z analizy zaowocuje nieobciążonym oszacowaniem czasu przeżycia albo czasu pozostałego do zdarzenia.

Nieparametryczne metody Analizy Przeżycia: Estymator Kaplana-Meiera

 

Ta metoda wylicza prawdopodobieństwo śmierci w pewnym punkcie czasu warunkowego względem przeżycia aż do tego punktu. Wykorzystuje informacje z ocenzurowanych jednostek aż do momentu, w którym pacjent jest ocenzurowany. Zatem maksymalizuje wykorzystanie dostępnych informacji o czasie do zdarzenia z próbki badań. Równanie by otrzymać prawdopodobieństwo przeżycia w czasie ‘t’ wywodzi się z następującego równania:

S(t)= πt (1−dt/nt)

 w którym dt/nt odpowiada prawdopodobieństwu śmierci w czasie ‘t’ warunkowym do bycia zagrożonym (żywym) w czasie ‘t-1’.

Ocenzurowane jednostki są wykluczone z mianownika ‘zagrożonych’ jednostek w momencie gdy zostają ocenzurowane, jednakże, są zawarte w każdym poprzedzającym to punkcie. Nie są zawarte w liczniku w żadnym momencie. Tabele 1 i 2 pokazują odpowiednio hipotetyczny zbiór danych i wyliczenie prawdopodobieństwa przeżycia z wykorzystaniem estymatora Kaplana-Meiera.

cenzurowane dane w bazie danych

Hipotetyczne dane ilustrujące analizę przeżycia

Estymacja kaplana mayera

Hipotetyczna ilustracja oszacowania prawdopodobieństwa przeżycia S(ti) z wykorzystaniem estymatora Kaplana-Meiera

Cenzurowanie oddziałuje na kształt krzywej przeżycia w sytuacji gdy ogromna liczba jednostek jest ocenzurowana w jednym punkcie czasu co prowadzi do nagłych, nieprawdziwych skoków lub wielkich zjazdów na krzywej przeżycia. Inne czynniki prowadzące do takich nieprawdziwych skoków zawierają ekstremalnie niską liczbę jednostek zagrożonych, szczególnie blisko zakończenia badania albo wcześniej zaaranżowanego harmonogramu wizyty klinicznej. Statystyczna istotność różnic pomiędzy dwoma lub więcej krzywych przeżycia jest ustalana przez test log-rank (test logarytmiczny rang).

Rzetelność różnych fragmentów krzywej przeżycia jest zależna od liczby zagrożonych na tym stopniu. Większość badań mających do czynienia z analizą czasu przeżycia prawdopodobnie posiada jednostki których rezultaty zdarzeń a zatem czas do zdarzenia albo rezultatu nie są zapisywane. To wynika z niedostatku zasobów (pieniądze i czas) by prowadzić badania aż do efektów (szczególnie w terminalnych przypadkach) zarejestrowanych dla każdego oddzielnego przypadku. By mieć miary dojrzałości danych, zatem by stały się imperatywne w pokazywaniu jakości danych w warunkach właściwości indywidualnych gdzie efekty zdarzeń i czas do zdarzenia są rejestrowane. Prostsze środki zawierają średnią (medianę) okresu działań następczych. Jednakże, silniejsza graficzna technika obejmuje stworzenie modelu krzywej przeżycia przez odwrócenie cenzurowania, np. oznakowanie zmarłych pacjentów jako ocenzurowanych i vice-versa i obliczenie czasu do działań następczych dla tego zbioru danych. Zatem mediana czasu do działań następczych jest oszacowana z wykorzystaniem techniki która ma do czynienia z cenzurowaniem w takim samym stopniu jak z czasem przeżycia.

Parametryczna Analiza Przeżycia: metody wykładnicza i Weibulla

 Tak jak w nieparametrycznych podejściach, w analizie danych czasu do zdarzenia, modele w podejściu parametrycznym czerpią oszacowania ze statystyk czasu porażki kiedy wyjaśniają obecność cenzurowania w danych. Główną różnicą pomiędzy tymi dwoma podejściami jest to, że to drugie próbuje czerpać oszacowania wykorzystując parametryczny model, który ma specyficzne założenia o rozkładzie czasu porażki przez założenie o szczególnej, funkcyjnej formie dla stopnia ryzyka. Ta funkcyjna forma może uściślić stopień ryzyka jako funkcję w czasie albo może dołączyć współzmienną objaśniającą, w której przypadek stopy ryzyka jest sprecyzowany jako funkcja czasu i konkretnej współzmiennej. Tym sposobem czas porażki jest związany z zestawem współzmiennych, a zatem prowadzi do podejścia regresyjnego.

Parametryczne metody analizy przeżycia zakładają rozkład stopnia ryzyka jako funkcji w czasie, a poza tym jeszcze jest założenie o niezależnym cenzurowaniu. Stopień ryzyka jest natychmiastowym prawdopodobieństwem śmierci w następnym, krótkim przedziale warunkowym po przetrwaniu do czasu ‘t’. Wyrażenie dt/nt w równaniu Kaplana-Meiera jest stopniem ryzyka. Mianownik nt zawiera całkowity czas podejmowanych działań do czasu ‘t’ zarówno dla jednostek, które są zagrożone i ocenzurowane. Licznik dt jest liczbą jednostek, które umrą/doświadczą rezultatów zdarzenia, na krótko po przedziale czasowym ‘t’. Cenzurowanie odgrywa podobną rolę w modelach jak w przypadku nieparametrycznego ryzyka i warunków niezależnego cenzurowania. Cenzurowanie jest dostosowane do parametrycznych modeli przez wcielenie stopnia ryzyka, które wykorzystuje podobny estymator Kaplana-Meiera. Kiedy model włącza współzmienne, warunek o niezależności cenzurowania jest założony w obecności współzmiennych.

Metoda Weibulla zakłada, że stopień ryzyka zmienia się (wzrasta lub spada) jednostajnie w czasie. Stopień ryzyka i inne parametry rozkładu Weibulla są pokazane w Tabeli 1. Jeżeli stopień ryzyka jest zależny od czasu, zwiększa się dla wszystkich wartości P>1, zmniejsza się dla P<1 i jest stały dla P=1.

Wykładniczy rozkład jest specjalnym przypadkiem rozkładu Weilbulla dla P=1, co sugeruje, że stopień ryzyka nie zmienia się w czasie. Stała wartość stopnia ryzyka prowadzi do stałego prawdopodobieństwa śmierci, które nie zmienia się wraz przebiegiem badania ani czasem. To sugeruje fakt, że prawdopodobieństwo śmierci podczas jakiegokolwiek danego przedziału jest zależne tylko od długości w czasie tego przedziału, z bezpośrednio proporcjonalnym związkiem. Wprost przeciwnie, jest ono niezależne od punktu rozpoczęcia i zakończenia przedziału czasowego.

Ważnym jest by sprawdzić rozkład stopnia ryzyka dla każdego zbioru danych. Jako, że wykładniczy rozkład zakłada stały stopień ryzyka, może być zapisany tak:

S(t)= e-λt

Co również może być zapisane tak:

Log [S(t)]= -λt or – Log [S(t)]= λt                               Weźmy logarytmy na obie strony,

Log{- Log [S(t)]}= logλ + log t

To jest równanie linii prostej, której krzywa ‘b’ jest równa 1. Zatem uzupełniająca transformacja logarytmiczna np. Log{- Log [S(t)]}, naprzeciw log t, jest efektywnym narzędziem oceniającym stałość stopnia ryzyka co sugeruje wykładniczy rozkład.

Semi-parametryczna metoda analizy przeżycia: metoda proporcjonalnego hazardu Coxa 

Parametryczne modele omówione powyżej precyzują konkretną postać dla funkcji ryzyka w czasie. Jako takie, te modele w pełni charakteryzują rozkład porażek w czasie jako funkcje w czasie (i współzmienne). Jeżeli jednak, głównie interesuje nas ustalenie jak nowy lek wpływa na przeżywalność względem starego leku, wtedy postać funkcji dla ryzyka w czasie nie musi być sprecyzowana. To prowadzi do semi-parametrycznych modeli regresji używanych do opisania czasu przeżycia w sensie porównawczym, z których najpowszechniej używanym jest model proporcjonalnego hazardu Coxa.

Model proporcjonalnego hazardu Coxa nie jest typowo parametryczną metodą gdyż nie zakłada żadnych funkcyjnych postaci rozkładu stopnia ryzyka. Jednakże, zakłada że funkcja ryzyka z każdych dwóch jednostek jest proporcjonalna względem współczynnika ustalonego przez współzmienne, które są stałe w czasie. Oczywiście, jeśli ktoś jest niepewny funkcyjnej formy stopnia ryzyka, zastosowanie semi-parametrycznego podejścia będzie preferowaną alternatywą okazałych, konkretnych założeń parametrycznych. Rozważając semi-parametryczne założenie, współczynnik ryzyka funkcji dla każdych dwóch jednostek jest stały w czasie i ustalony przez wartości współzmiennych tych jednostek. To ostatnie jest niczym innym jak wyrażeniem względnego ryzyka.

Proporcjonalność założenia o semi-parametrycznej metodzie może być oceniona zarówno graficznie przez wykreślenie krzywych przeżycia albo przez średnie testu statystycznego, w zależności od tego która hipoteza zerowa zostaje odrzucona jeżeli wartość P jest poniżej poziomu istotności. W graficznym zobrazowaniu, założenie proporcjonalności jest spełnione wtedy kiedy dwie krzywe przeżycia nie przecinają się. Ewentualnie, przydatna jest komplementarna transformacja logarytmiczna, Log{- Log [S(t)]}. Wykreślony podwójny logarytm dwóch krzywych przeżycia np. Log{- Log [S(1)]} i Log{- Log [S(2)]} jest linią prostą warunkującą poprawność założenia proporcjonalności.

Oprócz parametrycznych i semi-parametrycznych metod opisanych powyżej, metody stopniowania regresji są wykorzystywane by uporać się z czasem do zdarzenia przy obecności cenzurowania danych. Asymptotyczna normalność estymatorów zachodzi przy pewnych założeniach. Ta metoda robi użytek z teorii martingale i zacieśnia lemat dla stochastycznych całek wieloparametrycznego procesu empirycznego.

Dopasowanie metod analizy przeżycia 

Nieparametryczne metody jak estymator Kaplana-Meiera i model proporcjonalnego hazardu Coxa są najpowszechniej stosowanymi metodami analizy przeżycia w literaturze dotyczącej zdrowia publicznego. Metoda Kaplana-Meiera jest adekwatna kiedy nie ma założenia o funkcyjnym rozkładzie stopnia ryzyka w czasie. Jednak jeśli nie ma założenia o stopniu ryzyka, nie możliwa jest ekstrapolacja wyników badania poza jego okresem. Parametryczne metody są pozbawione tej wady i wykorzystuje się je do ekstrapolacji wyników badania poza okresem badania. Parametryczne i semi-parametryczne metody pomagają również w zapoznaniu się z wpływem współzmiennych na czasy przeżycia. Jednak niewłaściwym jest uniwersalne przyjmowanie wykładniczego rozkładu, zwłaszcza w przypadku ocen przeżycia tuż po urodzeniu i ocen przeżycia po poważnej operacji, uwzględniając wiedzę, że oceny umieralności są wyższe w początkowym stadium życia i okresie pooperacyjnym i, odpowiednio, odtąd stopniowo spadają. Semi-parametryczne metody przydają się w takich sytuacjach. Metoda proporcjonalnego hazardu Coxa ma dodatkową zaletę gdyż jest zdolna do ustalenia 11wpływu współzmiennych takich jak czynniki demograficzne, naturalne katastrofy i otrzymane leczenie w stopniu ryzyka/przeżycia.

Przewagą modelu proporocjnalnego hazardu Coxa nad logarytmicznymi testami rang jest zdolność do używania dawnych, ciągłych i kategorycznych (po stworzeniu atrapy zmiennej), zmiennych. Z drugiej strony test log-rank nie poradzi sobie ze zmiennymi ciągłymi.

Ekstrapolacja oszacowań przeżycia poza kontynuacją badań 

Badanie epidemiologiczne oszacowujące przeżywalność są zwykle krótkookresowe co jest zależne od zebrania wystarczającej liczby jednostek by zapewnić stosowne punkty końcowe badania, które zasilają badanie ustalą różnicę we wpływie współzmiennych na czas do zdarzenia na istotnym poziomie. Jednak pomimo tych krótkich kontynuacji, jest w wielu przypadkach istotne by ekstrapolować wyniki na dłuższy okres czasu. Jest to słusznie szczególnie w przypadku przewidywań ekonomicznych, gdzie horyzont musi być wystarczająco wielki, w wielu sytuacjach długości całego życia, by wskazać markery decyzyjne do podejmowania ważkich decyzji. Powyższa deklaracja szczególnie pasuje do programów prewencyjnych gdzie benefity z wprowadzenia programu zaczynają się pokazywać i przynosić owoce w dłuższej perspektywie czasowej.

Ekstrapolacja wyników wymaga założenia o tym jak obecne wyniki zmienią się w upływie czasu, np. funkcyjny stopień ryzyka w czasie. Może założyć, że wpływ współzmiennych na stopień ryzyka zostanie taki sam po następnych okresach; albo zaniknie; albo nastąpi sytuacja pośrednia. Alternatywnie metoda parametryczna może być użyta do przemodelowania zaobserwowanych danych na ekstrapolowane wyniki. To jest właśnie aplikacja Weibulla i metod wykładniczych. No i krzywe przeżycia z badań obserwacyjnych są połączone z obecnymi danymi z badania. Dane z badań obserwacyjnych, które maksymalnie pasują do obecnych krzywych przeżycia są używane do modelowania wyników poza następnym okresem.

Wnioski 

Zdajemy sobie sprawę z tego, że ten artykuł nie zgłębia w pełni pewnych drobniejszych aspektów związanych z metodami analizy przeżycia. Tym niemniej, może on służyć jako dobra notatka dla żółtodziobów zainteresowanych analizą przeżycia. Obecny esej omawia rolę technik w analizie przeżycia na indywidualnym poziomie danych pacjenta wśród cenzurowania, które jest szeroko stosowane przez związanych ze zdrowiem ekonomistów, specjalistów od zdrowia publicznego, badaczy socjologii i zachowań ludzkich. W cenzurowaniu prawostronnym mamy przede wszystkim do czynienia z zastosowaniem tych metod analizy przeżycia, podczas gdy w cenzurowaniu interwałowym statystycy używają technik imputacyjnych. Cenzurowanie lewostronne nie jest zwykle problematyczne w starannie zaprojektowanych badaniach klinicznych, ponieważ punkt początkowy albo początek ryzykownego okresu jest określony przez coś takiego jak randomizacja albo wystąpienie interwencji.

Niezależność cenzurowania (lub cenzurowanie nie-informacyjne) jest najważniejszym założeniem we wszystkich metodach. Jednakże, to założenie może być unieważnione w sytuacjach określanych jako „kruche” np. gdy czas pomiędzy dwoma nawracającymi zdarzeniami (chociażby powtórzona infekcja) jest źródłem naszego zainteresowania. Niektóre jednostki mogą być bardziej narażone, albo z nieznanych przyczyn posiadać tendencję do nawracających zdarzeń.

Nieparametryczne metody takie jak Kaplan-Meier, Log Rank i testy Wilcoxona są najczęściej używanymi metodami przy analizie przeżycia. Ulepszone wersje z zastosowaniem prognostycznych współzmiennych informacji są stosowane, co sprawia, że oszacowania Kaplana-Meiera są dużo mocniejsze przy obecności cenzurowania. Wpływ współzmiennych oddziałowujących na oceny przeżycia zwykle jest poskramiany z użyciem metody proporcjonalnego hazardu Coxa. Ostatni rozwój specjalistycznych oprogramowani wygenerował większe zainteresowanie stosowaniem parametrycznych metod które oferują dodatkowe zalety i pozwalają ekstrapolować wyniki po zakończenia okresu badania.