Statystyczny Scoring – etapy budowy modelu karty scoringowej.
Kroki konstrukcji statystycznego modelu scoringowego.
– kumulacja danych o klientach
– charakterystyka klienta złego i dobrego.
– selekcja populacji na podstawie której konstultowany będzie model scoringowy
– eksploracja danych
– selekcja zmiennych do konstrukcji modelu statystycznego
– zbudowanie modelu statystycznego
– ocena podjętych kroków wraz z oceną modelu statystycznego – klasyfikacyjnego
– ustalenie tresholdu
– implementacja
– kontrola karty scoringowej
-
Ocena statystyczna zmiennych potencjalnie mogących budować model.
Na tym etapie dokonuje się weryfikacji zmiennych pod kątem autentyczności (dokonuje się oceny miar tendencji centralnej i dyspersji), braków danych oraz obserwacji mogących potencjalnie wpływać znacząco na wyniki analiz statystycznych.
-
Charakterystyka dobrego i złego klienta.
Definicja powinna opierać się o maksymalną nieterminową spłatę lub o maksymalny trwający limit spłaty zobowiązania. Może, ale nie musi opierać się o zmianę kondycji finansowej klienta.
-
Selekcja populacji wschodzącej do zbioru uczącego i testowego.
Populację analizowana dzieli się na próbę uczącą/treningową (na której analiza statystyczna uczy się wzorców) oraz na populację testową na której testuje się wyselekcjonowaną analizę statystyczną.
-
Weryfikacja statystyczna i selekcja zmiennych do modelu.
Do statystycznego modelu scoringowego selekcjonuje się zmienne, które pozwalają na dyskryminację złych i dobrych klientów oraz takie które przyjmują stabilną zmienność temporalną. Ponad to o selekcji zmiennych decyduje też logika biznesowa. Zazwyczaj zarząd lub menadżerowie wyższego szczebla doskonale się orientują w mocy predykcyjnej danych zmiennych. Podejściami w selekcji zmiennych jest na pierwszym miejscu wiedza ekspercka, statystyki zależności i różnic np. iloraz szans (ODDS RATIO), miara phi, eta kwadrat, d Cohena, miara KS, V Cramera, miara IV oraz WoE, procedury krokowe (postępowania lub eliminacji).
-
Oszacowanie współczynników modelu i rating modelu pod względem jakości (wyrażonej w charakterystykach ilościowych).
Po selekcji odpowiedniego (pod względem jakości) modelu do predykcji ryzyka zasadne jest oszacowanie współczynników modelu. W praktyce testuje się następujące modele:
– regresja liniowa
– regresja logistyczna
– analiza dyskryminacyjna
– regresje Coxa
– drzewa decyzyjne
– SVM
Ilościowa ocena jakości modelu jest oceniana zazwyczaj po budowie i przetestowaniu modelu na populacji obserwacji testowych oraz obserwacjach z poza próby (np. na skrawkach informacji pozostałych w fazie wyboru próbki).
-
Ustalenie tresholdu.
Punkt odcięcia jest punktem w którym ustala się sytuacje w której podejmuje się decyzję o udzieleniu bądź nie kredytu lub pożyczki. Pozwala to na przyspieszenie decyzji i ograniczenie czasu oczekiwania do kliku, niekiedy sekund. Można przyjąć punkt odcięcia w wysokości 0,5, może również minimalizować to ze względu na koszty podjęcia złych decyzji czyli kosztu nieudzielenia kredytu dobremu klientowi oraz udzielenia kredytu złemu klientowi.
-
Kontrola karty scoringowej.
Personel banku powinien być edukowany w zakresie pojęcia i etyki jakim jest statystyczny credit scoring. Używanie scoringu powinno być ubrane w wystandaryzowane procedury polegające na ograniczeniu podejmowania decyzji innych niż sugerowanych przez scoring statystyczny. W uniwersum podejmowania decyzji innych niż zalecanych przez scoring, bank powinien nakreślić spektrum czynników mogących zmienić tę decyzję oraz ich odsetek. Każda niestandardowa decyzja powinna być wyrażona w odpowiednim raporcie.
-
Implementacja i kontrolowanie karty scoringowej w czasie.
Plan implementacji nowej karty scoringowej w banku (który lepszy (champion challenger) jest strategią sprawdzenia pracy nowej karty scoringowej na żywej i nowej grupie klientów. Oczywiście na testowanie efektów potrzeba odpowiedniego upływu czasu, dlatego eksperymentowanie i majstrowanie w kartach scoringowych powinno być przemyślane i inteligentnie planowane