Metodologia Data Minig – Crisp DM. Struktura procesu.

Metodolog - statystyczna analiza data minig

Co to jest data mining?

Ogromne ilości danych są generowane każdego dnia przez urządzenia, strony internetowe, instytucje państwowe, firmy/przedsiębiorstwa oraz badania naukowe. Dane te posiadają wiele odpowiedzi na pojawiające się problemy spotykające wyżej wymienione przedsięwzięcia. Jak można użytecznie wyciągać informacje i wiedzę z takich ogromnych zbiorów danych?

Tak zwany data mining/big data to ogromny biznes. Dostęp do danych rośnie szybciej niż rzeżucha na święta. Świat biznesu, organizacji oraz nauki czerpie korzyści z wyrafinowanych technik i analiz statystycznych które pomagają w ogarnięciu tych wartościowych zasobów informacji.

Techniki data mining są wykorzystywane tam gdzie klasyczne metody statystyczne mają trudność z pokonaniem ilości dostępnych danych. Może to być ogromna liczba obserwacji, zmiennych lub szybkość z którą dane muszą być przetwarzane. Techniki data mining pozwalają uzyskiwać informacje z tych danych poprzez odkrywanie ukrytych wzorców, trendów sprzedażowych, preferencji zakupowych klientów lub kluczowych informacji z których korzysta inteligentne i strategiczne zarządzanie.

Proces data miningu/ drążenia danych zawiera w sobie:

  • identyfikacje obszarów ryzyka, oszustw i zanieczyszczeń w danych
  • reguły zależności, znajdowania związków między zmiennymi i budowania spersonalizowanych rekomendacji i porad
  • grupowanie i analizy identyfikujące klastry klientów do których można kierować odpowiedni przekaz reklamowy
  • sieci neuronowe które identyfikują złożone wzorce i zamieniają je na predykcje oparte na – rasowym poziomie – sztucznej inteligencji
  • drzewach decyzyjnych generujących sekwencje najlepszych decyzji w celu oszczędnego lub strategicznego działania

Często obliczeniowe metody otwierają pełen potencjał tkwiący w wielkich zbiorach danych. Analizy wielkich zbiorów danych  to przyszłość podejmowania decyzji i strategicznego planowania działań.

 

Struktura procesu. Data Mining Crisp DM

W jednym miejscu przedstawiamy Wam nasze wszystkie wpisy dotyczące kompleksowej metody analizy danych jaką jest Crisp DM. Jest to zaawansowana metoda analizy statystycznej w biznesie, ale tez również w nauce (szczególnie w przypadku odkrywania wiedzy z danych w kontekście badań eksploracyjnych). Poniżej przedstawiamy wszystkie linki do wpisów o technice data mining jaką jest metodologia CRISP DM.

Zaawansowana metoda Data Mining Crisp DM.
CRISP-DM etap drugi – Zebranie danych wstępnych i zrozumienie danych
CRISP-DM etap trzeci – preparowanie danych – Wybór danych
CRISP-Data Mining etap czwarty – modelowanie i wybór techniki modelowania
CRISP-DM etap piąty – ewaluacja czyli ocenianie wyników
CRISP-DM etap szósty – wdrażanie – plan wdrożenia