Propensity Score Matching – W skrócie.

 

meto

Pewnie dużo słyszałeś wcześniej o dopasowaniu propensity score. Czym one są i jak można ich używać ?

Propensity scores są użyteczne kiedy próbujemy wyciągnąć doraźne wnioski z badań obserwacyjnych gdzie „manipulacja eksperymentalna” nie była losowo przydzielana wybranym obserwacjom. Dla uproszczenia przypuśćmy, że zmienna niezależna ma dwa poziomy T=1 (manipulacja) i T=0 brak manipulacji. W badaniach randomizowanych, propensity score jest znany, dla przykładu: jeśli manipulacja została przydzielona do uczestników poprzez kostkę lub monetę, wtedy propensity score dla wszystkich wynosi 0,5. W typowych badaniach obserwacyjnych, propensity score nie jest znany, ponieważ manipulacja nie była przydzielana przez badacza. W tym przypadku, propensity score często jest szacowany poprzez dopasowanie wartości przewidywanych z regresji logistycznej (lub innej metody klasyfikacyjnej)  zbudowanej z charakterystyk badanych. W badaniach obserwacyjnych, manipulowana grupa i grupa kontrolna, nie są bezpośrednio porównywalne, ponieważ mogą się one różnic już u podstaw. Propensity score odgrywa ważną rolę w wybalansowaniu grup badawczych by stały się porównywalne. Rosenbaum & Rubin (1983) pokazali, że manipulowana ni kontrolna grupa z takimi samymi propensity scorami miała identyczne rozkłady dla wszystkich zmiennych bazowych. Ta „balansująca właściwość” oznacza, że jeśli kontrolujemy propensity score kiedy porównujemy grupy, mamy efektywny zwrot z badania obserwacyjnego do badania eksperymentalnego, gdzie obserwacje w grupach mają te same charakterystyki. Możesz się zastanawiać, czemu potrzebujemy kontroli propensity score, bardziej niż bezpośrednia kontrola bazowych zmiennych ? Zakładamy, że relacja między zmienną zależną a niezależną jest liniowa, a ta dla wszystkich w obu grupach T1 i T0 jest taka sama.

 

Autorem tekstu jest Konrad Hryniewicz

Źródło tekstu: https://methodology.psu.edu/eresources/ask/fa07

cv