Statystyka

Słowo „statystyka ma kilka rożnych znaczeń.

Statystyka – Pierwsze i najpowszechniej zna­ne to:

  • gromadzenie, prezentacja i analiza materiałów liczbowych (statystyki urzę­dowe, rejestry administracyjne itp.); tego typu statystykę uprawiano od bar­dzo dawna.

Drugie znaczenie, znajdujące zastosowanie w statystyce matematycznej, to: • statystykę nazywana jest każda mierzalna funkcja zmiennych losowych. Oczywiście statystyka też jest zmienną losową; warunek mierzalności funk­cji nie jest tutaj żadnym ograniczeniem, gdyż w ramach tego wykładu każda z używanych przez nas funkcji zmiennych losowych jest funkcją mierzalną, oraz trzecie znaczenie:

# statystyka jest rozumiana jako zespół metod służących do analizy danych, umożliwiających znajdowanie pewnych prawidłowości czy uogólnianie zależ­ności. Statystyka w tym znaczeniu nazywana bywa statystyką matematyczną.

Warto sięgnąć do historii zbierania danych i przytoczyć kilka z interesują­cych systemów opisanych przez Rao (1994).

  • statystyka – Chiny – 2000 lat p.n.e., w czasach dynastii Sia przeprowadzano spisy lud­ności. Za dynastii Czou (1122-256 p.n.e.) ustanowiono oficjalne stanowi­sko odpowiedzialnego za prace statystyczne (księgowego). Interesowano się wówczas takimi sprawami, jak np. ile rodzin posiada ziemię i domy? Jaki­mi zasobami żywności dysponuje rodzina? Ile jest wdowców, wdów, sierot, inwalidów i chorych? Ilu mężczyzn zdolnych do służby wojskowej można zmobilizować w nagłym przypadku? Ilu ludzi potrzebnych by było do reali­zacji różnych ważnych dla państwa przedsięwzięć? Jak liczne i jak zamoż­ne są pewne mniejszości, które mogłyby czuć się dotknięte planowanymi zmianami w prawach o własności lub o związkach małżeńskich? Jaka jest zdolność podatkowa kraju, prowincji własnych i sąsiednich? Jak widać z ka­talogu przykładowych pytań, zbierane dane dostarczały bardzo ważnych informacji umożliwiających sprawne zarządzanie państwem. Współcześnie nic więcej w tej materii nie wymyślono.
  • Statystyka – W Europie rzymski spis ludności został ustanowiony przez szóstego króla Rzymu Serwiusza Tuliusza (578-543 p.n.e.). W ramach tego systemu, w pię­cioletnich odstępach czasu sporządzano rejestr obywateli i ich własności w celach podatkowych i w celu wyznaczenia liczby mężczyzn zdolnych do służby wojskowej.
  • statystyka – W Indiach skomplikowany system rejestrów administracyjnych lub sta­tystyk urzędowych istniał już przed 300 r. p.n.e. Odpowiedni rachmistrz (rachmistrz wiejski) miał obowiązek prowadzić wszelkiego rodzaju rejestry dotyczące ludności, użytkowania ziemi, produkcji rolnej itp. Zaliczał on domy do płacących albo niepłacących podatki, rejestrował całkowitą liczbę mieszkańców ze wszystkich czterech kast w każdej wsi, a także prowadził dokładne zestawienia liczby rolników, pasterzy, kupców, rzemieślników, wyrobników, niewolników, zwierząt dwunożnych i czworonożnych. Ponad­to ustalał zasoby złota, wolnej siły roboczej, myta i grzywien, które można zebrać z każdego domu.
  • statystyka – Francja ustanowiła Centralny Urząd Statystyczny w roku 1800 jako pierw­szy tego rodzaju urząd na świecie.
  • statystyka – W Wielkiej Brytanii w 1834 roku powstało Królewskie Towarzystwo Staty­styczne (pod początkową nazwą: Londyńskie Towarzystwo Statystyczne). Wtedy już statystykę uważano za „fakty odnoszące się do ludzi, możliwe do przedstawienia w postaci liczb, w wystarczająco zwielokrotnionej ilości, sygnalizujące prawa ogólne”.

Statystyka – Na statystykę matematyczną, jako zespół metod służących do analizy da­nych, też można spoglądać z różnych punktów widzenia.

Można ją traktować jako naukę w tym sensie, że ma swoją własną tożsamość z dużym repertuarem technik wywodzących się z pewnych zasad podstawowych i jest to teoretyczny aspekt statystyki. W tym zakresie tworzona jest teoria statystyki i teoretyczne rozwiązania konkretnych problemów. Tak jak cała matematyka, statystyka wy­korzystuje rozumowanie dedukcyjne.

Natomiast w zakresie zastosowań statystyki do rozwiązywania zadań prak­tycznych można ją traktować z jednej strony jako technikę w tym sensie, że metodologię statystyczną można wbudować w każdy działający system.

Metody statystyczne można również wykorzystywać do kontrolowania, redukowania i uwzględniania niepewności, a przez to do maksymalizowania efektywności działania osób i instytucji, zaś z drugiej strony jako sztukę, po­nieważ jej metodologia, która zależy od rozumowania indukcyjnego, nie jest w pełni skodyfikowana ani wolna od kontrowersji. Skłanianie liczb, by „same mówiły”, zależy od wprawy i doświadczenia statystyka.

Powyżej zostało użyte pojęcie rozumowania indukcyjnego. Ogólnie rozu­mowanie indukcyjne to decydowanie o przesłankach, gdy dysponujemy pew­nymi ich następstwami.

Jest to rozumowanie, które umożliwia podejmowanie decyzji o świecie rzeczywistym, wykorzystując niepełne lub wadliwe informa­cje.

Pełne informacje są praktycznie niemożliwe do zdobycia, gdyż w celu ich uzyskania należałoby przebadać np, całą populację Polski. Również rzetelność zebranych informacji nigdy nie jest stuprocentowa. Wszelkie badania są wyko­nywane przez ludzi za pomocą odpowiednich narzędzi, mogą to być narzędzia pomiarowe albo testy psychologiczne i bardzo rzadko możemy być do końca pewni, że żaden z uzyskanych wyników nie jest obarczony pewnym błędem, niekoniecznie zresztą zamierzonym.

Wnioskowanie indukcyjne jest procesem logicznym, w którym uogólnia­my przypadek szczególny. Tworzymy w ten sposób nową wiedzę, ale jest ona obarczona niepewnością z powodu braku pełnych informacji wykorzystanych w procesie indukcyjnym. Czy w związku z tym ta nowa wiedza jest nieprzydat­na? Na początku XX wieku zrozumiano, że mimo iż wiedza uzyskana według jakiejkolwiek zasady uogólniania szczegółów jest wiedzą niepewną, staje się wiedzą użyteczną (zwróćmy uwagę: wiedzą użyteczną, a nie wiedzą pewną), je­śli potrafimy wyrazić ilościowo odpowiadającą jej niepewność (Rao, 1994). Jeśli zatem musimy podejmować decyzje w warunkach niepewności, to nie możemy uniknąć popełnienia błędów.

Fakt, iż podejmujemy decyzje przy braku pełnej informacji, leży u pod­staw wszystkich metod statystycznych. Podejmowane przez nas decyzje mogą być zatem decyzjami błędnymi, lecz jednocześnie będziemy zawsze starali się określić (oszacować z góry) ryzyko (prawdopodobieństwo) podjęcia błędnej decyzji.