Propensity score matching.

meto

 

Propensity Score matching 

Ostatnio sporo słyszałem o wynikach skłonności. Co to właściwie jest i jak mogę ich użyć? – z poważaniem, Lost Cause

Drogi czytelniku;

Meotdy propensity scorem matching przydają się, gdy próbujemy wyciągać przyczynowe wnioski z badań obserwacyjnych, w których „warunek” (np. „niezależna zmienna” lub domniemana przyczyna) nie został losowo przydzielony. Dla uproszczenia, przyjmijmy że zmienna niezależna ma dwa poziomy: uwarunkowany (T=1) i nieuwarunkowany (T=0). Wynik skłonności dla tego obiektu to prawdopodobieństwo, że obiekt był uwarunkowany, P(T=1). W losowym badaniu, wynik skłonności jest znany, na przykład, jeżeli warunek został przydzielony do każdego obiektu za pomocą rzutu monetą. Wtedy score matching dla każdego obiektu to 0,5. W typowym badaniu obserwacyjnym, wynik propensity score matchingu nie jest znany, gdyż warunki nie są przydzielane przez badacza. W takim przypadku, wyniki propensity są często szacowane przez dopasowanie wartości z regresji logistycznej z T na bazowej (przed-warunkowej) charakterystyce obiektu.

W badaniach obserwacyjnych, uwarunkowane i nieuwarunkowane grupy nie są bezpośrednio porównywalne, ponieważ mogą metodycznie różnić się u podstaw. Wynik skłonności odgrywa ważną rolę w bilansowaniu grup badania tak by zrobić je porównywalnymi. Rosenbaum i Rubin (1983) wykazali, że uwarunkowane i nieuwarunkowane obiekty z takim samym wynikiem skłonności mają identyczny rozkład dla wszystkich bazowych zmiennych. „Bilansująca własność” znaczy, że jeżeli kontrolujemy wynik skłonności porównując grupy, to w praktyce zmieniliśmy badanie obserwacyjne na zrandomizowany eksperyment blokowy, w którym „bloki” to grupy obiektów z takimi samymi propensity scorami.

Być może się zastanawiasz: dlaczego potrzebujemy kontrolować propensity score, zamiast kontrolować bezpośrednio bazowe zmienne? Kiedy zredukujemy wynik dla T i inne bazowe charakterystyki, współczynnik dla T jest średnią przyczynowości efektu tylko po spełnieniu dwóch wymagających warunków. Zakłada on, że relacja pomiędzy reakcją a bazową zmienną są liniowe, i że wszystkie odchylenia się takie same niezależnie czy T=0 czy T=1. Więcej skomplikowanych analiz modeli kowariancji (ANCOVA), może dać lepsze wyniki, ale one tworzą inne założenia. Wyniki skłonności zapewniają alternatywne sposoby by oszacować średnią przyczynowości efektu dla T bez ciężkich założeń o tym jak reakcja jest powiązana z bazową zmienną.

Jak więc używamy propensity score matching by oszacować średnią przyczynowość efektu T? Ponieważ wynik skłonności ma bilansującą właściwość, możemy podzielić próbę na podgrupy (np. kwintale) bazując na wynikach propensity. Następnie możemy oszacować efekt T wewnątrz każdej podgrupy dzięki zwykłemu t-testowi i zgromadzić wyniki wszystkich podgrup. Alternatywy dla dalszego podziału zawierają dopasowywanie i ważenie. W dopasowywaniu, znajdujemy podzbiór nieuwarunkowanych jednostek, których wynik propensity score jest podobny do tych uwarunkowanych osób, albo odwrotnie (Rosenbaum, 2002). W ważeniu, porównujemy średnie ważone dla reakcji na uwarunkowane i nieuwarunkowane osoby, ważąc uwarunkowanych według 1/P(T=1) i nieuwarunkowanych według 1/P(T=0)(Luceford & Davidian, 2004). Jednak, ogromne wagi mogą sprawić, że oszacowanie będzie niepewne.

Więcej na:

Propenisty SCORES

Propensity score matching statystyczny wpływ netto zmiennej niezależnej na zmienną zalezną

Regula najbliższego sąsiada analiza skupień najbliższego sąsiedztwa