Trend (np. szeregu czasowego)

Trend (np. szeregu czasowego) – Jest to tendencja rozwoju danego zjawiska. Jest to ogólna reprezentacja systematycznych zmian. Np. zjawisko może cały czas wzrastać w czasie np. akcje pewnej innowacyjnej firmy na giełdzie (trend liniowy). Z trendem nieliniowym mamy np. do czynienia w momencie sprzedaży prądu w ciągu roku (mniej się go produkuje w lato a więcej w zimę).

Wdrożenie modelu ( jeden z etapów data mining / big data )

Wdrożenie modelu ( jeden z etapów data mining / big data ) –  jest to ostatni etap procesu data mining w którym wymodelowany silnik statystyczny pracuje nad przewidywaniem lub klasyfikowaniem np. stopy zwrotu z inwestycji w startup lub oceną klienta jako tego który spłaci kredyt lub nie ( podejście CREDIT SCORING).

Eksploracja danych ( jeden z etapów data mining )

Eksploracja danych ( jeden z etapów data mining ) –   Eksploracja danych i informacji jest to najważniejszy i najcenniejszy etap postępowania analitycznego. Podczas eksploracji danych wypełniane są braki danych, czyści się dane z wartości odstających, przekształca się zmienne, standaryzuje, redukuję się ich ilość. Celem tego procesu jest zmniejszenie ilości danych do postaci w której będą  mogły być efektywnie przetwarzane przez analityka lub interpretatora. Eksploracja danych i jej kierunek zależy głównie od postawionego problemu badawczego. Niekiedy eksploracja będzie tylko poznaniem rozkładów i liczebności zmiennych a niekiedy będzie polegała na redukcji wielkich wolumenów pomiarów w kilka czynników za pomocą metod grupowania lub analiz głównych składowych. Ważne podczas eksploracji danych jest zwrócenie uwagi na obserwacje odstające, odsetek braków danych, wartości nietypowe lub przypadkowe. Potencjalnie te dane mogą wpływać na oszacowania przeprowadzanych później analiz.

Data Mining (jako zgłębianie danych)

Data Mining (jako zgłębianie danych)  jest to metodologia analizy danych przeznaczona do weryfikacji i ekstrakcji wiedzy z wielkich zasobów danych w odnajdywaniu trendów oraz replikujących się korelacji pomiędzy badanymi zmiennymi (business intelligence). Po wykonaniu analiz lub zbudowaniu modeli aplikuje się ów modele do nowych danych. Ostateczną częścią podejścia data mining jest przewidywanie np. sprzedaży produktów, szansy spłaty, ryzyka straty itp. Funkcja przewidywawcza data miningu jest bardzo cenna ponieważ pozwala na redukcję kosztów lub zwiększenie sprzedaży lub obu tych czynników. Proces data mining można podzielić na kilka części. Pierwszym etapem jest eksploracja danych, drugim jest budowa modeli przewidujących lub klasyfikujących, a trzecim jest wdrożenie i stosowanie modeli w kontekście napływu nowych danych by kontrolować nowo napływające informacje o klientach, procesach lub stanie urządzeń. Najnowsze trendy w biznesie definiują stanowisko analityka data mining jako posadę data scientist.

Big data

Big dataInnymi słowy jest to eksploracja i analiza bardzo dużych wolumenów danych. BIG DATA  to badanie dużych zasobów informacji, najczęściej powiązanych z kwestiami gospodarczymi,  w poszukiwaniu regularnych wzorców zachowań bądź tendencji oraz współzależności pomiędzy zmiennymi, a następnie do oceny wyników poprzez zastosowanie wykrytych wzorców do nowo zebranych danych. Celem data mining w kontekście BIG DATA jest najczęściej przewidywanie zachowań klientów, wielkości sprzedaży, prawdopodobieństwa utraty klienta (business intelligence). W analizie danych biznesowych definiowane jest stanowisko analityka data mining jako posada data scientist.