Wybór zmiennych ( BIG DATA / Data Mining )

Wybór zmiennych ( BIG DATA / Data Mining ) – Bardzo ważnym etapem analizy danych jest wybór zmiennych wejściowych do analizy. Wykorzystuje się to w przypadku kiedy wiele zmiennych ze sobą konkuruje lub są ze sobą silnie skorelowane. Niekiedy też zbyt duże obciążenie zmiennymi wejściowymi może skutkować nieefektywnymi i trudnymi do interpretacji modelami. Przy tym podejściu należy użyć metod które w sposób jednoznaczny odsieją zmienne wejściowe powiązane,  na zadowalającym poziomie,  ze zmienną zależną.