Eksploracja danych ( jeden z etapów data mining )

Eksploracja danych ( jeden z etapów data mining ) –   Eksploracja danych i informacji jest to najważniejszy i najcenniejszy etap postępowania analitycznego. Podczas eksploracji danych wypełniane są braki danych, czyści się dane z wartości odstających, przekształca się zmienne, standaryzuje, redukuję się ich ilość. Celem tego procesu jest zmniejszenie ilości danych do postaci w której będą  mogły być efektywnie przetwarzane przez analityka lub interpretatora. Eksploracja danych i jej kierunek zależy głównie od postawionego problemu badawczego. Niekiedy eksploracja będzie tylko poznaniem rozkładów i liczebności zmiennych a niekiedy będzie polegała na redukcji wielkich wolumenów pomiarów w kilka czynników za pomocą metod grupowania lub analiz głównych składowych. Ważne podczas eksploracji danych jest zwrócenie uwagi na obserwacje odstające, odsetek braków danych, wartości nietypowe lub przypadkowe. Potencjalnie te dane mogą wpływać na oszacowania przeprowadzanych później analiz.