ZASTOSOWANIE ANALIZY STATYSTYCZNEJ „Wiedzę buduje się z faktów, jak dom z kamienia

Metodolog - statystyczna analiza data minig

Metodolog.pl – Analiza Statystyczna w nauce

Firma statystyczna METODOLOG

ZASTOSOWANIE ANALIZY STATYSTYCZNEJ

Wiedzę buduje się z faktów, jak dom z kamienia; ale zbiór faktów nie jest wiedzą, jak stos kamieni nie jest domem”

Henri Poincaré

Codziennie wytwarzane są miliony nowych informacji. Prowadząc przedsiębiorstwo niezwykle istotną jest analiza dostarczanych informacji na temat zachowania na interesującym rynku. Poszczególne strzępki informacji nie dostarczą nam jeszcze wiedzy, lecz dopiero zastosowanie metod statystycznych przybliży nas do poznania istoty kształtowania się poszczególnych czynników i interesujących nas zagadnień, np. popytu na produkowane przez przedsiębiorstwo dobro.

Jednym z powszechniejszych zastosowań metod statystycznych, jest zastosowanie ich w analizie popytu. Poprzez zaspokajanie popytu rynkowego na towary i usługi, przedsiębiorca stara się osiągnąć główny cel swojej działalności – zysk. Znajomość popytu rynkowego determinuje prawidłowe planowanie potrzeb oraz zmniejsza niepewność w zarządzaniu. W związku z tym analiza popytu jest istotnym elementem planowania produkcji. Niestety bez znajomości metod statystycznych, nie da się jej przeprowadzić. Z pomocą przychodzą nam wnioskowanie statystyczne oraz funkcja regresji.

Ale czym jest popyt? Funkcją popytu na produkowany przez przedsiębiorstwo towar nazywamy funkcję uzależniającą wielkość popytu na dany produkt (świadczoną usługę) od zmiennych objaśniających – czynników kształtujących popyt:

Q= f(X1,X2,…,Xn)

Q- popyt

X1,X2,…,Xn – n zmiennych objaśnianych

Jednym ze sposobów podziału popytu, jest ten w którym jako kryterium wykorzystuje się miary statystyczne – średnią i wariancję. W przypadku popytu losowego wartość wariancji jest wysoka, natomiast wartość średnia – niska. W sytuacji odwrotnej – gdy wariancja przyjmuje niską wartość, średnia – wysoką mówimy o popycie nieciągłym. Zarówno niska wartość wariancji jak i niska wartość średnia oznacza popyt „gładki”, natomiast w przeciwnym razie gdy obydwie wartości są wysokie, możemy mówić o popycie nierównomiernym. Taki podział przybliża nas do poznania istoty zachowania zmiennych wpływających na kształtowanie się popytu.

Kolejnym krokiem na drodze do poznania istoty kształtowania się zmiennej objaśnianej na podstawie zmiennych objaśniających, jest dopasowanie rozkładu doświadczalnego do jednego z rozkładów teoretycznych. Załóżmy, że popyt jest zmienną losową. Na podstawie danych historycznych kształtowania się popytu, ustalamy parametry rozkładu prawdopodobieństwa zmiennej losowej. W zależności od charakteru zmiennej losowej, wielkości popytu w poszczególnych okresach analizowanego odcinka określane być mogą przy pomocy funkcji gęstości i jej dystrybuanty (ciągła) bądź prawdopodobieństwa (dyskretna).

Znajomość stosunku wartości średniej do wariancji lub odchylenia standardowego, często umożliwia dokonanie doboru rozkładu teoretycznego. Rozkład Poissona rozważyć możemy gdy zmienność jest większa od średniej. W przypadku gdy średnia jest wyższa od wariancji, możemy pomyśleć o rozkładzie normalnym. Natomiast rozkład wykładniczy możemy wziąć pod uwagę, kiedy średnia ma wartość zbliżoną do wartości odchylenia standardowego.  Jednak założenia te nie zawsze się sprawdzą. W celu sprawdzenia czy dany rozkład teoretyczny oddaje istotę rozkładu empirycznego należy wykonać odpowiednie testy statystyczne. Na przykład nieparametryczne testy zgodności: d Kołmogorowa-Smirnowa, test chi-kwadrat, Shapiro-Wilk, Lillieforsa.

W badanej zbiorowości pojawić się mogą wartości nietypowe oraz wpływowe. Przyczyn pojawienia się wartości nietypowej może być wiele, np. niejednorodność zbiorowości statystycznej lub nieoczekiwane wydarzenia. To jak dana zmienna oddziałuje na model, może uplasować ją jako zmienną o wartości nietypowej lub zmienną o wartości wpływowej. O pierwszej mówimy, gdy jej wartość empiryczna mocno odbiega od wartości przewidywanej (teoretycznej). Z druga mamy do czynienia gdy nieznaczna zmiana jej wartości lub usunięcie z danych znacznie zmieniają to jak wygląda model (jego paramtery). Jeżeli chcemy zidentyfikować takie zmienne, to możemy np.

  • wyznaczyć odległość Mahalanobisa MD
  • wskazać reszty większe co do wartości bezwzględnej od dwuipółkrotnego błędu standardowego reszt
  • określić statystykę chi.

Świadomość występowania wartości nietypowych lub wpływowych w badanej zbiorowości jest kluczowa, dla uzyskania prawidłowych wyników. Przeoczenie ich, mogłoby doprowadzić do błędnego wnioskowania na temat zbiorowości statystycznej, do niezrozumienia istoty kształtowania się zmiennej objaśnianej poprzez zmienne objaśniające. Usunięcie wartości nietypowych z analizowanego fragmentu może sprawić, że zbudowany na jej podstawie model będzie trafniej oddawał rzeczywiste kształtowanie się zmiennej endogenicznej. Jednakże usuwanie wartości odstających nie zawsze jest usprawiedliwione. Czasami występowanie wartości, mocno odbiegającej od wartości teoretycznych znajduje swoje uzasadnienie. Jako przykład posłużyć mogą opóźnienia w dostosowywaniu się wartości popytu do zidentyfikowanych czynników.  By trafnie ocenić charakter wartości i źródło jej ukształtowania, nie wystarczy jedynie wiedza z zakresu metod statystycznych, ale również znajomość badanej materii, i teorii związanych z badanymi zagadnieniami. Dopiero ten duet wiedzy teoretycznej i umiejętności testowania, analizowania jest w stanie przysłużyć się nam w poznaniu istoty badanej zmiennej.

Analiza statystyczna jest nieodłącznym elementem sprawnego funkcjonowania przedsiębiorstwa. Znajomość metod statystycznych pozwala na prognozowanie przyszłego popytu na to co dane przedsiębiorstwo wprowadza na rynek, a co za tym idzie – zysku z zawieranych transakcji. Stosowanie nie tylko takich miar jak najbardziej popularna – średnia, lecz także wariancja, odchylenie standardowe, czy odchylenie ćwiartkowe pomaga zrozumieć zachowanie podmiotów na rynku, a analiza rozkładu zbiorowości powie nam na jej temat więcej niż moglibyśmy się spodziewać.