Liniowa analiza dyskryminacyjna Metodolog.pl

Analiza dyskryminacyjna

Analiza dyskryminacyjna – umożliwia budowanie modelu klasyfikacji do grup. Model dyskryminacyjny jest budowany w oparciu o funkcje dyskryminacyjne ( lub w przypadku więcej ilości grup zestawu funkcji dyskryminacyjnych) na podstawie liniowych kombinacji predyktorów, które zapewniają najlepsze rozróżnienie między grupami. Funkcje są wyliczane ze zbioru obserwacji o znanej przynależności. Funkcje otrzymane z modelu dyskryminacyjnego mogą być użyte do klasyfikowania nowych obserwacji dla których przynależność nie jest znana. Przykładowo chcemy oszacować, na podstawie danych o wieku, płci, wysokości dochodów, ilości dzieci oraz wydatkach, to czy ktoś spłaci zobowiązanie kredytowe lub nie. Funkcja dyskryminacyjna może przybrać postać D= a*wiek + b*płeć + c*dochody + d*ilość dzieci + e*wydatki.

Wyniki funkcji dyskryminacyjnej będą się różnić dla osób które spłacają i nie spłacają zobowiązań kredytowych. Analiza dyskryminacyjna ma dużo założeń. Obserwacje powinny być niezależne. Zmienne dyskryminujące powinny mieć wielowymiarowy rozkład normalny, a macierz wariancji-kowariancji powinna być podobna w każdej z grup. Analiza jest najefektywniejsza kiedy predyktory nie są skorelowane. Procedura ta jest dostępna w większości pakietów statystycznych (analiza SPSS, analiza SAS, analiza Statistica, analiza GNU R, analiza orange ).