Regresja logistyczna – Analiza klasyfikacyjna.

Budowa modelu regresji logistycznej pozwala na oszacowanie prawdopodobieństwa wystąpienia jakiegoś zdarzenia w zależności od zestawu zmiennych które wpływają na pojawienie się ów badanego zjawiska.

Model równania analizy logistycznej szacuje się za pomocną metody MNW (Metoda Największej Wiarygodności). Celem jest zmaksymalizowanie wiarygodności zajścia zdarzenia 0 (porażka, śmierć, wypadek) i 1 (sukcesu, przeżycia, ocalenia). Zmienną która wpływa na zdarzenia może być mierzona na każdej skali pomiarowej. Analiza pozwala na wnioskowanie o % zdarzeń które wyjaśnia analiza oraz % wskaźnik poprawności przewidywania zdarzenia. Analiza pozwala również wykryć wpływ każdej ze zmiennych na prawdopodobieństwo wystąpienia zdarzenia i to, ile możemy się pomylić w szacowaniu. Do wizualizacji używa się wynalezionej podczas Drugiej Wojny Światowej krzywej ROC, za pomocą której szacowano naloty bombowe. Pole powierzchni pod krzywą wskazuje na siłę zmiennej wpływającej na pojawienie się zdarzenia. Na rysunku nr 1 przedstawiającym krzywe ROC widać że zmiana filtra oleju wpływa bardziej na awarię niż spóźnienie się z wymiana oleju. Płeć na szczęście nie wpływa na awarię.

Analiza regresji logistycznej jest bardzo często używana w problemach klasyfikacyjnych. Bardzo szczególnym problemem w którym analiza regresji logistycznej ma zastosowanie jest analiza i modelowanie ryzyka kredytowego. W tym kontekście modeluje się zmienne wejściowe, tworzy interakcje między nimi, a także tworzy się pochodne zmiennych w celu maksymalizowania prognozy tego czy ktoś spłaci kredyt/ pożyczkę lub nie. W tym przypadku analiza regresji logistycznej jest jedną z najbardziej skutecznych metod statystycznej analizy danych. Wiele symulacji oraz lata praktyki pozycjonują regresję logistyczną na pierwszym miejscu pod względem oceny jakości (widzianej z perspektywy zdolności modelu do separacji grup oraz stabilności jego szacowania). Regresję logistyczną wykorzystuje się również w badaniach i analizach medycznych (biostatystka). Jest ona doskonałą metodą wyjaśniającą i opisującą wpływ różnych zmiennych o stanie zdrowia pacjentów na występowanie różnych czynników chorobowych. Podobnie badacze wykorzystują regresję logistyczną w psychologii. Coraz częściej w publikacjach pojawiają się informacje na temat przewidywań zachowań ludzi opartych właśnie o prognozy z wykorzystaniem analizy regresji logistycznej. Test ten jest wspaniałym narzędziem do budowy zaawansowanych modeli wyjaśniająco klasyfikujących. Analiza ta nie jest skomplikowana w swej interpretacji oraz jest odporna na niespełnienie różnych założeń, które wymagają inne testy statystyczne (np. analiza dyskryminacyjna). Najważniejszą procedurą w kontekście tej analizy jest przygotowanie danych, przekształcenia, wybór odpowiednich zmiennych oraz diagnostyka modelu. To ona tych czynności zależy jakość wyników oszacowanych przez regresję logistyczną oraz ich stabilność oraz zdolność samego testu do uogólniania wiedzy na nowych danych. Bardzo gorąco polecamy tę procedurę, stosujemy ją od lat z sukcesem w analizach w kontekście medycyny, inżynierii, ekonometrii, psychometrii, pielęgniarstwie i coraz częściej w biznesie (firmy pożyczkowe, ubezpieczeniowe) i marketingu. Na życzenie jesteśmy przedstawić naszą autorską (lecz bardzo podobną w detalach) metodologię modelowania systemów klasyfikacyjnych opartych właśnie o oszacowania regresji logistycznej.

Jeśli chciałbyś przetestować możliwości tej wspaniałej procedury to się z nami skontaktuj. Opowiemy Ci jak jej użycie może wpłynąć na wnioski z Twojego badania, albo jak może to usprawnić działanie Twojego biznesu. W pierwszej kolejności możemy omówić Twój problem klasyfikacyjny i zaproponować możliwości aplikacji regresji logistycznej lub innej metody klasyfikacyjnych np. rozbudowanych drzew decyzyjnych lub analizy skupień. Wszystko zależy od tego z jakimi problemami mamy do czynienia. Nasz warsztat analityczny ma cały arsenał analiz statystycznych oraz metod opracowywania raportów i analiz statystycznych. Wszystko po to by poskromić każdy rodzaj danych. W szczególnych przypadkach jesteśmy wstanie sięgnąć po najnowsze i nieznane, a czasem niestandardowe rozwiązania. Poniżej prezentujemy skrótowy opis technik statystycznych wykorzystywanych poza regresją logistyczną. Być może, że któreś z tych podejść będzie bardziej odpowiadało na Twoje potrzeby i będzie bardziej dopasowane do problemów badawczych w kontekście tworzenia Twojej nauki lub rozwoju biznesu.

Zachęcamy do zapoznania się z naszym warsztatem.