analiza statystyczna wyników badań

Jakie jest stanowisko ASA (Amerykańskie Stowarzyszenie Statystyczne) na temat wartości p (istotności) w odniesieniu do psychologii?

Jakie jest stanowisko ASA (Amerykańskie Stowarzyszenie Statystyczne) na temat wartości p (istotności) w odniesieniu do psychologii?

„Żaden pojedynczy index nie powinien zastępować rozumowania naukowego”

– Oficjalne stwierdzenie ASA (Amerykańskiego Towarzystwa Statystycznego)

Oficjalne stanowisko Amerykańskiego Statystycznego Towarzystwa jest takie, że wartość istotności (p-value) jest złą miarą dowodową. My jako psychologowie potrzebujemy skalibrować nasze intuicje co do tego co jest dobrym dowodem. Zobacz pełne oświadczenie tutaj : Link do oficjalnej publikacji .

Amerykańskie Towarzystwo Statystyczne właśnie wydało swoje długo obiecywane oficjalne oświadczenie dotyczace swojego stanowiska wobec wartości istotności statystycznej. Jeśli tego nie pamiętasz (nie przejmuj się, to było lata temu), ASA odpowiedziało na BASP (Basic and Applied Social Psychology) na szeroko publikowanego banu  istotności statystycznej tak:

Grupa więcej niż 24 wybitnych statystyków profesjonalistów rozwija oświadczenie ASA na temat istotności statystycznej i wnioskowania, które podkreśla problemy i konkurujące ze sobą punktu widzenia. ASA zachęca redaktorów tego czasopisma (BASP) i innych mogących dzielić ich obawy, aby rozważyć co jest oferowane w stanowisku ASA, które pojawi się jeszcze w tym roku i nie odrzuca właściwego i odpowiedniego wykorzystania wnioskowania statystycznego.

Ten rozwój jest szczególnie istotny dla psychologów, ponieważ istotność statystyczna jest wszechobecna w naszej literaturze. Myślę, że w swoim życiu widziałem tylko garść artykułów bez istotności (głównie były to teoretyczne publikacje). Czy używamy zatem tego poprawnie? Co jest właściwą statystyką w kontekście badań naukowych, a konkretnie w psychologii? ASA jest tutaj by ukierunkować nasze myślenie o tym.

Zakres oświadczenia.

Oświadczenie zaczyna się od powiedzenia „Kiedy istotność statystyczna zaczyna być użyteczną statystyczną miarą, jest ona powszechnie nadużywana i błędnie interpretowana” Aby pomóc wyjaśnić jak wartość istotności statystycznej powinna być używana ASA „ wierzy, że społeczność naukowa, może skorzystać z oficjalnego i formalnego twierdzenia wyjaśniającego kilka powszechnie uzgodnionych zasad podkreślających prawidłowe użycie i interpretację wartości istotności. – ” Ich deklarowanym celem jest wyrażenie „ w nietechnicznych terminach kilku wybranych interpretacji, które mogły by polepszyć przeprowadzanie wnioskowań w kontekście ilościowej nauki, w związku z powszechną zgodną w statystycznej społeczności.”

Po kolei. Czym jest istotność statystyczna?

ASA podała następującą definicję istotności statystycznej:

„Istotność jest prawdopodobieństwem w określonym modelu statystycznym, który statystyczne podsumowuje dane (dla przykładu, średnia różni się między dwiema porównywanymi grupami) jako równe lub większe niż ekstremalna wartość.

Tak więcej istotność statystyczna jest stwierdzeniem prawdopodobieństwa w zaobserwowanych danych oraz danych bardziej ekstremalnych niż te obserwowane, dając podkreślenie statystycznemu modelowi (np. odrzucając hipotezę zerową).

Sześć zasad używania wartości p.

Podstawowym sensem oświadczenia jest to, że: Istotność statystyczna (p-value) może być używana jako miara niedopasowania pomiędzy danymi w modelu (np. hipotezy zerowej), ale ta miara nie mówi nam o prawdopodobieństwie, ze hipoteza zerowa jest prawdziwa. Miara ta nie mówi nam jakie działania powinniśmy podjąć – zgłosić to do dużego journala, zrozygnować/kontynuować linię badań, implementować interwencję. Nie mówi to nam jak duży lub ważny jest studiowany efekt. Bardziej ważne jest (w mojej opinii) to, że nie daje nam znaczącej miary dowodowej w odniesieniu do modelu lub hipotezy.

O to zasady interpretacji wartości istotnośćci (p-value).

  1. Istotność statystyczna może wskazywać jak niekompatybilne są dane w specyfikowanym modelu.
  2. Istotność statystyczna nie mierzy prawdopodobieństwa, że badana hipoteza jest prawdziwa albo prawodopodobieństwa, że dane zostały wytworzone przez przypadek.
  3. Naukowe konkluzje oraz biznesowe i polityczne decyzje nie powinny bazować tylko na tym czy wartość istotności przechodzi określony próg.
  4. Właściwe wnioskowanie wymaga pełnego raportowania i przejrzystości.
  5. Wartość istotności statystycznej nie mierzy siły efektu oraz znaczenia wyniku.
  6. Sama w sobie wartość istotności statystycznej nie stanowi dobrej miary potwierdzenia odnoszącego się do modelu lub hipotezy.

Więc co to znaczy dla psychologów?

ASA daje wiele jednoznacznych rekomendacji i warto przeczytać ich cały (lecz krótki) raport. Myślę, że najważniejszą zasadą jest zasada 5 i 6. Psycholodzy głównie używają wartości istotności statystycznej (p- value) jako miary dowodzenia uzyskanego przeciwko hipotezie zerowej. Przeprowadzasz badanie, sprawdzasz istotność statystyczną i jeśli jest ona poniżej wartości 0,05 to wtedy masz znaczące dowody przeciwko hipotezie zerowej, a potem czujesz usprawiedliwione wątpienie i konsekwentną pewność w kierunku swojej wyrażającej jakieś istnienie hipotezy.

ASA mówi nam co nie jest dobrą praktyką. Biorąc istotność statystyczną jako silny dowód tylko dlatego, że jest niższa niż wartość 0,05 jest aktualnie mylące: ASA szczególnie mówi „ istotność bliska 0,05 to słaby dowód na rzecz fałszywości hipotezy zerowej”. Wartość istotności statystycznej bliska 0,05 jest tylko osiągnięciem maksymalnego czynnika Bayesa na poziomie -/+ 2, co jest bardzo słabym poziomem dowodzenia i wiarygodności.

Najważniejsze jest to” Musimy skorygować nasze intuicje o tym co stanowi adekwatne dowody. Psychologia jest taka, że dowody na jej istnienie są niedopuszczalnie słabe na początku, kiedy prawidłowo oceniamy dowody z oryginalnych badań. Widzimy, że są przesłanki do wiary aby sądzić, że  afekty istniały od początku. Bazując na tak słabej przesłance jaką jest istotność statystyczna nie ma się co dziwić, że niepowodzenia replikacji są naturalną konsekwencją niskich standardów dowodowych.

Istnieje wiele (bardzo wiele) artykułów w statystycznej literaturze pokazujące, że wartość istotności statystycznej przecenia dowody przeciwko hipotezie zerowej. Teraz także ASA podjęła oficjalne stanowisko.

Poniżej umieszczamy kilka cytatów, które są odpowiednie dla praktykujących psychologów.

  1. Naukowcy powinni uznać, że wartość istotności statystycznej bez kontekstu lub innych dowodów dostarcza ograniczonej informacji. Dla przykładu wartość istotności statystycznej bliska 0,05 podjęte przez siebie oferuje tylko słabe dowodzenie przeciwko hipotezie zerowej. Ponad to stosunkowo duża wartość p nie implikuje dowodów na rzecz faworyzowania hipotezy zerowej. Wiele innych hipotez może być równych lub bardziej spójnych z obserwowanymi danymi. Z tego powodu analiza danych powinna nie kończyć się na kalkulacji wartości istotności statystycznej w przypadku kiedy inne metody mogą być odpowiednie i wykonalne.
  2. Z uwagi na powszechne nadużycia i nieporozumienia dotyczące wartości p, niektórzy statystycy preferują zastąpienie lub nawet zamianę wartości istotności z innymi podejściami. Zawierają się w tym metody, które podkreślają oszacowanie ponad testowanie takie jak ufność, wiarygodność lub przedziały dla predykcji. Metody Bayesowskie jako alternatywne miary dowodzenia np. wskaźniki prawdopodobieństwa lub czynniki Bayesa.
  3. Powszechnie użycie „statystycznej istotności” ogólnie interpretowane jako p<0,05 jako licencji na tworzenie twierdzeń o odkryciu naukowym (lub domniemania prawdy) prowadzi do znacznego wypaczenia procesu naukowego i publikowanej wiedzy.
  4. Ilekroć badacz wybiera co przedstawić na podstawie statystycznych wyników, ważne interpretacje tych wyników są mocno przeceniane przez czytelnika. Naukowcy powinni ujawniać liczbę hipotez eksplorowanych podczas badania, wszystkie dane dotyczące zbierania danych i wszystkich policzonych analiz i wartości istotności. Ważne naukowe konkluzje bazujące na wartości istotności (p-value) i związanymi z nimi statystykami nie mogą być wyciągane z bez znajomości co najmniej tego ile i jakich analiz dokonano i jak te analizy (zawierające istotność statystyczną) zostały wyselekcjonowane do raportowania.
  5. Statystyczna istotność nie jest ekwiwalentem naukowości. Mniejsze wartości istotności niekoniecznie sugerują obecność mniejszego lub większego efektu, a większe wartości p nie oznaczają braku znaczenia lub nawet braku efektu.

 

ryzyko kredytowe analiza statystyczna ryzyka kredytowego

Modelowanie statystycznego systemu scoringowego.

meto

 

Statystyczny Scoring  – etapy budowy modelu karty scoringowej.

Kroki konstrukcji statystycznego modelu scoringowego.

– kumulacja danych o klientach

– charakterystyka klienta złego i dobrego.

– selekcja populacji na podstawie której konstultowany będzie model scoringowy

– eksploracja danych

– selekcja zmiennych do konstrukcji modelu statystycznego

– zbudowanie modelu statystycznego

– ocena podjętych kroków wraz z oceną modelu statystycznego – klasyfikacyjnego

– ustalenie tresholdu

– implementacja

– kontrola karty scoringowej

 

  1. Ocena statystyczna zmiennych potencjalnie mogących budować model.

Na tym etapie dokonuje się weryfikacji zmiennych pod kątem autentyczności (dokonuje się oceny miar tendencji centralnej i dyspersji), braków danych oraz obserwacji mogących potencjalnie wpływać znacząco na wyniki analiz statystycznych.

  1. Charakterystyka dobrego i złego klienta.

Definicja powinna opierać się o maksymalną nieterminową spłatę lub o maksymalny trwający limit spłaty zobowiązania. Może, ale nie musi opierać się o zmianę kondycji finansowej klienta.

  1. Selekcja populacji wschodzącej do zbioru uczącego i testowego.

Populację analizowana dzieli się na próbę uczącą/treningową (na której analiza statystyczna uczy się wzorców) oraz na populację testową na której testuje się wyselekcjonowaną analizę statystyczną.

  1. Weryfikacja statystyczna i selekcja zmiennych do modelu.

Do statystycznego modelu scoringowego selekcjonuje się zmienne, które pozwalają na dyskryminację złych i dobrych klientów oraz takie które przyjmują stabilną zmienność temporalną. Ponad to o selekcji zmiennych decyduje też logika biznesowa. Zazwyczaj zarząd lub menadżerowie wyższego szczebla doskonale się orientują w mocy predykcyjnej danych zmiennych. Podejściami w selekcji zmiennych jest na pierwszym miejscu wiedza ekspercka, statystyki zależności i różnic np. iloraz szans (ODDS RATIO), miara phi, eta kwadrat, d Cohena, miara KS, V Cramera, miara IV oraz WoE, procedury krokowe (postępowania lub eliminacji).

  1. Oszacowanie współczynników modelu i rating modelu pod względem jakości (wyrażonej w charakterystykach ilościowych).

Po selekcji odpowiedniego (pod względem jakości) modelu do predykcji ryzyka zasadne jest oszacowanie współczynników modelu. W praktyce testuje się następujące modele:

– regresja liniowa

– regresja logistyczna

– analiza dyskryminacyjna

– regresje Coxa

– drzewa decyzyjne

– SVM

Ilościowa ocena jakości modelu jest oceniana zazwyczaj po budowie i przetestowaniu modelu na populacji obserwacji testowych oraz obserwacjach z poza próby (np. na skrawkach informacji pozostałych w fazie wyboru próbki).

  1. Ustalenie tresholdu.

Punkt odcięcia jest punktem w którym ustala się sytuacje w której podejmuje się decyzję o udzieleniu bądź nie kredytu lub pożyczki. Pozwala to na przyspieszenie decyzji i ograniczenie czasu oczekiwania do kliku, niekiedy sekund. Można przyjąć punkt odcięcia w wysokości 0,5, może również minimalizować to ze względu na koszty podjęcia złych decyzji czyli kosztu nieudzielenia kredytu dobremu klientowi oraz udzielenia kredytu złemu klientowi.

  1. Kontrola karty scoringowej.

Personel banku powinien być edukowany w zakresie pojęcia i etyki jakim jest statystyczny credit scoring. Używanie scoringu powinno być ubrane w wystandaryzowane procedury polegające na ograniczeniu podejmowania decyzji innych niż sugerowanych przez scoring statystyczny. W uniwersum podejmowania decyzji innych niż zalecanych przez scoring, bank powinien nakreślić spektrum czynników mogących zmienić tę decyzję oraz ich odsetek. Każda niestandardowa decyzja powinna być wyrażona w odpowiednim raporcie.

  1. Implementacja i kontrolowanie karty scoringowej w czasie.

Plan implementacji nowej karty scoringowej w banku (który lepszy (champion challenger) jest strategią sprawdzenia pracy nowej karty scoringowej na żywej i nowej grupie klientów. Oczywiście na testowanie efektów potrzeba odpowiedniego upływu czasu, dlatego eksperymentowanie i majstrowanie w kartach scoringowych powinno być przemyślane i inteligentnie planowane

 

analiza statystyczna metodolog

Wykonanie analizy czynnikowej w praktyce.

meto

 

Wykonanie analizy czynnikowej w praktyce.

Wstęp.

Analiza czynnikowa jest metodą statystyczną polegającą na redukcji danych. Jej celem obliczeniowym jest wyszukanie powiązanych ze sobą zmiennych mogących mieć jakiś wspólny mianownik (wektor) np. pozycje kwestionariusza mierzące pewne spójne i reprezentatywne uniwersum zachowań np. ekstrawersję. Jest to dosyć prosta metoda statystyczna dająca bardzo zadowalające wyniki. Metodę tę często stosuje się w medycynie, psychologii, biostatystyce i psychometrii. Jej ekwiwalentem jest nowsza metoda o nazwie SVD (Singular Vector Decomposition). Obie metody zwracają podobne wyniki, lecz u podstaw leży inna metoda obliczeniowa i geneza powstania.

Aby przeprowadzić analizę czynnikową, nasze dane muszą spełniać kilka warunków:

  1. wszystkie zmienne muszą być mierzone na tej samej skali (chodzi tu o pozcyje testu)
  2. jeśli zmienne nie są wyrażone w tej samej jednostce pomiaru należy ów pomiary wystandaryzować
  3. odpowiedzi na pytania muszą charakteryzować się duża zmiennością (jeśli badani podobnie odpowiadali na dane pytanie w ankiecie to nie ma co takiego pytania włączać do analizy)
  4. badanych obserwacji powinno być tyle samo ile pozycji testowych, a z godnie z regułą kciuka 15 razy więcej
  5. nie powinno być sytuacji w której braki danych przekraczają 5%.

Zanim przeprowadzimy analize czynnikowa oprócz prostych statystyk opisowych musimy zrobić także bardziej skomplikowaną analizę, polegająca na diagnostyce dotyczacej tego czy nasze dane nadają się do przeprowadzenia analizy czynnikowej. Najlepiej jest uruchomić analize czynnikową.

Analiza miary K-M-O. Kryterium Kaisera/ Mayera / Olkina.

W analizie czynnikowej musimy podjąć na początku pewne decyzje związane z podstawowymi testami. Pierwszym kryterium jest ocena wyniku testu KMO. Miara KMO przyjmuje wartości od 0 do 1. Im wartość bliższa 1 tym bardziej wskazane jest przeporwadzenie analizy czynnikowej. Jeśli miara KMO jest niższa niż 0,7 to może być to spowodowane zbyt małą ilością badanych w stosunku do liczby pytań, złą konstrukcją pozycji testowych lub badana próba była zbyt jednorodna. Jeśli ocena wskaźnika KMO pozwoliła na akceptacje analizy to przeprowadzamy jeszcze raz analizę czynnikową.

Jak wyodrębniać czynniki?

W tym momencie musimy podjąć jakąś decyzję dotyczącą kryterium wyodrębniania czynników. Mamy do dyspozycji dwa kryteria.

Pierwszym jest kryterium Kaisera, które sugeruje wyodrebnienie tylu czynników ile sugerują wartości własne większe od 1 przy danym rozwiązaniu czynnikowym.

Drugim kryterium jest kształt wykresu osypiska (opartym o wartości własne). W kolejnym kroku podejmujemy decyzję o metodzie rotacji czynników. Decyzję o ilości czynników podejmujemy w oparciu  o wzrokową ocenę krzywizny linii na wykresie osypiska.

Rotacja.

W tym kroku podejmujemy decyzję o metodzie rotacji czynników. Jeśli test, który konstruujemy ma mieć więcej niż jeden wymiar, powinniśmy przeprowadzić jakąś z metod rotacji czynników, która spowoduje maksymalizację dostosować poszczególnym pozycji testowych do osi wyodrębnionych wymiarów. Po takiej rotacji macierz korelacji pytań/ pozycji testowych jest lepiej dopasowana a co za tym idzie, jest łatwiej interpretowana. Najczęściej wykonywane metody rotacji to metoda:

– Varimax

(metoda ortogonalna tak jak metoda Equamax i Quartimax) stosuje się ją do czynników potencjalnie będących od siebie niezależnych np. ekstrawersja i inteligencja.

– Promax

(metoda nieortogonalna, czyli ukośna. Metodą ukośną jest jeszcze metoda OBLIMIN z możliwością ustawienia stopnia korelacji między zmiennymi) Tą metodę stosuje się w przypadku silniego skorelowania wyodrebnianych wymiarów np. Inteligencja słowna i inteligencja matematyczna.

Interpretacja wyników procedury analizy czynnikowej.

Jest to jeden z trudniejszych etapów przeprowadzania analizy czynnikowej. Wpierw trzeba podjąć decyzję o ilości wariancji wyjaśnianej przez test. Jesli nie jest ona zadowalająca to trzeba się odnieść krytycznie do podjętych kroków wraz z rozpatrzeniem poprawności wykonania badania. Ponad to! Trzeba podjąć decyzję o pozycjach testowych wschodzących w skład danego czynnika i postarać się go nazwać. W większości wypadków pomaga w tym teoria leżąca u podstaw badanego narzędzia, lecz w przypadkach analiz eksploracyjnych takiego komfortu nie ma. Etykieta skomponowanego wymiaru powinna być uogólnieniem pozcyji wchodzących w skład skali.

Jeśli analiza czynnikowa dotyczy budowy kwestionariusza lub jego statystycznego przygotowania, zaleca się skonstruowanie klucza odpowiedzi. Jeśli analiza czynnikowa polega na redukcji danych mających zastosowanie w dalszych procedurach statystycznych zaleca się zapisanie tych wyników w jakimiś z języków programowania np. R lub Python.

analiza statystyczna ankiet

Modele scoringowe. Czym jest scoring i jakie ma zastosowanie?

meto

 

Modele scoringowe. Czym jest scoring i jakie ma zastosowanie?

Model scoringowy jest systemem oceny pozwalającej na utworzenie klasyfikowania klientów banku na podstawie wybranych cech. Metodologia credit scoringu to procedury weryfikacji statystycznej mającej na celu ocenę i podjęcie decyzji o przynależności klienta do dwóch klas: (1) klienta złego, (2) klienta dobrego. Modele scoringowe nie mają na celu ustalenia zdolności kredytowej (choć teoretycznie mogą to robić w innym układzie funkcyjnym), ale mają za cel przewidzenie tego czy klient banku spłaci w przyszłości swoje zobowiązanie kredytowe. To co system scoringowy ma na celu to nie wyjaśnienie modelowanego zjawiska (tak jak to robi się w badaniach naukowych), ale maksymalizowanie poprawności klasyfikacji obserwacji do wyżej wymienionych dwóch grup obserwacji. Koniec końców system scoringowy ma przewidzieć (co jest po części tylko wyjaśnieniem) spłatę pożyczki lub kredytu.

Model scoringowy ocenia rozsądność przydzielenia kredytu klientówi. Opiera się to o ocenę:

– chęci terminowej spłaty

– tej samej chęci wyrażonej w długoterminowej perspektywie czasowej

– opisaniu scenariusza dotyczącego rozwoju finansowego klienta

System scoringowy dostarcza najbardziej sprawidliwe narzędzie pozwalające na decydowaniu o tym komu pzydzielić, a komu nie nie przydzielać kredytu/ pożyczki.

Jakie są plusy korzystania z metody oceny Scoringowej ?

Pierwszym, chyba najważniejszym plusem jest poprawienie zysków i ograniczenie ryzyka w portfelu kredytowym. Drugim jest przyspieszona i sprawiedliwa decyzja polegająca na przydzieleniu lub nie odpowiednim osobom pożyczki lub kredytu. Kolejną korzyścią jest zredukowanie obciążeń finansowych wynikających z mniej zaawansowanych sposobów oceny.

Pola stosowania modelu scoringowego w instytucji pożyczkowej.

– ocena aplikacji klientów o kredyt

– wyższe zyski

– przyspieszenie i standaryzacja procedury podejmowania decyzji kredytowej

– możliwość oceny fraudów

– manipulowanie kosztami kredytu

– wgląd w potencjał wypłacalności klienta

– działania promocyjne i ofertowe

Typy modeli scoringowych.

– Scoring aplikacyjny stosuje się w kontekście klientów nieznanych lub przy nowych działaniach ze sstrony banku) Dzieję się to przy aplikowaniu klienta o kredyt. W skład oceny wchodzi klient oraz sam wniosek. Wnioskowanie odbywa się w kontekście oceny statusu finansowego oraz pozycji społecznej. W skład oceny zawyczaj wchodzi płeć, wiek, wykształcenie, zarobki, stan cywilny, typ prac itp. Itd.

– Scoring behawioralny stosuje się go w kontekście klientów od dawna będących klientami banku. Ocenia się zachowania klienta wyrażone w parametrach związanych z jego rachunkiem. Zazwyczaj ocenia się klienta z perspektywy roku. Jest on wykonywano tylko raz. Pojęcie tego modelu scoringowego pochodzi od zachowania per-se. Ocenie scoringowej klient jest poddawany cały czas i odnosi się on do tych klientów z którymi kontekt został nawiązany na zasadzie wspólnej relacji. Często w kontekście oceny przez ten scoring wystepują takie zmienne jak czas relacji z bankiem, liczba aktywnych rachunków, zmienność środków na koncie w czasie, średni obrót pieniędzy, poślizgi czasowe w wywiązywaniu się ze zobowiąza.

– Scoring (jako metoda klasyfikacyjna) stosuje się go w procedurach promowania i wykrywania przestępstw bankowych.

Rodzaje kart scoringowych.

Scoringowa Karta Ekspercka

Karta ta opiera się o intuicje dotyczące klienta. Jest subiektywna ocena typu obserwuję i decyduję. Słabą stroną tego scoringu jest mała moc predykcyjna oraz brak możliwości poradzenia sobie z ogromem potencjalnie dostępnych danych. Plusami takiej karty scoringowej jest to, że lepszy jest rydz niż nic. Może być także zapoczątkowaniem idei porządkowania i zestawiania danych.

Scoringowa Karta Generyczna

Ta Karta Scoringowa zawiera w sobie oceny zebrane z różnych sektorów rynku i różnych dostawców informacji o klientach. Minusem takiej karty jest słaba moc predykcyjna oraz różnice polagające na zróżnicowaniu między rynkami z których pobiera się dane, a rynkiem działania danej instytucji. Plusem tej karty jest to, że jest o wiele lepsza od braku karty oraz karty eksperckiej oraz posiada jakaś statystyczną logikę.

Statystyczna Karta Scoringowa.

Jest to karta która w swej konstrukcji wykorzystuje tylko dane zagregowane przez instytujcę. Jej minusami są przeogromne wymagania dotyczące liczebności danych i ich jakości. Dane te oraz zmienne muszą być dokładnie weryfikowane by ograniczyć możliwość popełnienia niekorzystnych decyzji. Z minusów jest to, że karta scoringowa raz skonstruowana nie podlega dodatkowym modyfikacjom, chyba, że aktualizacją. Bardzo korzystną cechą scoringu statystycznego jest bardzo dokładna i skuteczna predykcja bazująca na rzeczywistych cechach i zachowaniach klientów.

Kroki konstrukcji statystycznego modelu scoringowego.

– kumulacja danych o klientach

– charakteryztyka klienta złego i dobrego.

– selekcja populacji na podstawie której konstuowany będzie model scoringowy

– eksploracja danych

– selekcja zmiennych do konstrukcji modelu statystycznego

– zbudowanie modelu statystycznego

– ocena podjętych kroków wraz z oceną modelu statystycznego – klasyfikacyjnego

– ustalenie tresholdu

– implementacja

– kontrola karty scoringowej

Jak zrobić statystykę do pracy magisterskiej?

Czemu statystyki są niezbędne w Psychologii?

meto

Wielu studentów psychologii jest zaskoczona (i czasem przerażona) realizacją kursu statystyki, która jest wymagana w ich wybranym kierunku.

Tak, kursy statystyki są ważną częścią prawie wszystkich psychologicznych programów. Nie tylko będziesz potrzebować wzięcia udziału w jednym bądź dwóch kursach statystyki. Prawdopodobnie również spotkasz się z tym tematem na wielu innych zajęciach, szczególnie tych które zawierają kwestie projektowania eksperymentów oraz poznawania metod badawczych.

Więc czemu statystyki są ważne w psychologii?

Po pierwsze pomyślmy o ważności statystyki w ogóle. Statystyki pozwalają nam na nadanie sensu i interpretowaniu wielu informacji. Rozważamy natłok danych, który można napotkać codziennie. Jak długo sypiasz? Jak wielu studentów w twojej grupie jadło śniadanie tego poranka? Jak wielu ludzi żyje w promieniu jednego kilometra od Twojego domu? Używając statystyk, możemy organizować i interpretować wszystkie te informacje w znaczący sposób.

W psychologii, jesteśmy również konfrontowani z olbrzymią ilością danych. Jak zmiana w jednej zmiennej wywiera wpływ na inne zmienne? Czy jest sposób dzięki, któremu możemy mierzyć ten związek? Jaka jest ogólna siła tego związku i co on oznacza? Statystyka pozwala nam na odpowiedzenie na takie rodzaje pytań.

Statystyka pozwala psychologom na:

  • Uporządkowanie danych. Kiedy radzimy sobie z nadzwyczajną ilością informacji łatwo stać się przez nie przytłoczonych. Statystyka pozwala psychologom prezentować dane w sposób, który jest łatwy do zrozumienia. Graficznie przedstawienie ich na grafach i wykresach, rozkładach częstości, wykresach rozrzutu stwarza możliwość badaczom lepszy przegląd danych i zobaczeniu wzorców, które mogłyby być w innym wypadku pominięte.
  • Opis danych. Pomyśl co się dzieje kiedy badacze zbierają wielką ilość informacji o grupach ludzi. Spis ludności jest najlepszym przykładem. Używając statystyk, możemy dokładnie opisać informacje które zostały zebrane w celu, łatwego zrozumienia. Statystyki opisowe dostarczają sposobu podsumowania tego co istnieje w danej populacji. Czyli np. jak wiele jest mężczyzn czy kobiet, ile mają dzieci lub ile ludzi jest bezrobotnych.
  • Centralne twierdzenie graniczne i błąd standardowy – łatwa i wciągająca opowieść o podstawie wnioskowania statystycznego.

    . Używając tego co jest znane jako wnioskowanie statystyczne, badacze mogą wyciągać wnioski o danej próbie lub populacji. Psycholodzy używają danych, które zebrali do testowania hipotez lub przewidywań tego co może się stać. Używanie tego typu statystycznego analizowania, badacze ustalają prawdopodobieństwo, że hipoteza powinna być potwierdzona lub odrzucona.

Statystyka w codziennym życiu.

Więc teraz masz lepsze zrozumienie czemu statystyki są ważne w psychologii, może być pomocne spojrzenie na kurs statystyki jako niepowtarzalna okazja. Oczywiście w solidnym zrozumieniu statystycznych metod może pomóc Ci np. excel. Po drugie, pomyśl o wszystkich twierdzeniach w psychologii, które spotykasz w codziennym życiu poza zajęciami. Magazyny publikują  historie o ostatnich odkryciach naukowych, samopomocowe książki wygłaszają różne kierunki w podchodzeniu do problemów, a wiadomości często wyolbrzymiają lub źle interpretują psychologiczne badania. Rozumiejąc proces badawczy oraz zawarte w nim rodzaje analiz statystycznych, które są używane, będziesz zdolny do stania się mądrym konsumentem informacji psychologicznych i będziesz lepiej oceniać informacje dochodzące do Ciebie.

Uzyskiwanie pomocy ze statystyką.

Oczywiście, znajomość tego czemu statystyki są istotne może niekoniecznie pomóc Ci z poczuciem strachu przed pierwszym wejściem na zajęcia pierwszego kursu statystyki. Jest tutaj dobra wiadomość. Nawet jeśli nie uważasz siebie za „dobrego z matematyki” to możesz dołożyć sił i skorzystać z mnóstwa narzędzi i źródeł, które mogą Ci pomóc. Zacznij dyskutować o swoich troskach ze swoim instruktorem. Może Ci zarekomendować książki, narzędzia w internecie, które mogą być pomocne. Rozważ przyłączenie lub uformowanie swojej własnej grupy adeptów statystyki ze swoimi znajomymi z klasy. Bardzo ważne jest to abyś nie przeoczył pomoce, która może być dostępna w Twojej szkole. Wiele ćwieczeniowców oferuje labolatoria matematyczne, gdzie studenci mogą otrzymać ekstra pomoc ze statystyki.

Czy na kierunku psychologii wymagana jest wielka wiedza matematyczna/statystyczna?

Na pierwszy rzut oka, wielu potencjalnych studentów psychologii twierdzi, że ich wybór kierunku wymaga niewiele matematyki. Mimo wszystko psychologia jest nauką o zachowaniu, więc co ma do tego matematyka?

Matematyka oraz statystyka w szczególności są ważnymi częściami każdego programu nauczania psychologii. Psycholodzy potrzebują zdolności w użytkowaniu statystycznych metod do przeprowadzania badań, analizy danych, interpretacji rezultatów oraz raportowania ich wyników.