problemy klasyfikacyjne

Regresja logistyczna – Analiza klasyfikacyjna.

Budowa modelu regresji logistycznej pozwala na oszacowanie prawdopodobieństwa wystąpienia jakiegoś zdarzenia w zależności od zestawu zmiennych które wpływają na pojawienie się ów badanego zjawiska.

Model równania analizy logistycznej szacuje się za pomocną metody MNW (Metoda Największej Wiarygodności). Celem jest zmaksymalizowanie wiarygodności zajścia zdarzenia 0 (porażka, śmierć, wypadek) i 1 (sukcesu, przeżycia, ocalenia). Zmienną która wpływa na zdarzenia może być mierzona na każdej skali pomiarowej. Analiza pozwala na wnioskowanie o % zdarzeń które wyjaśnia analiza oraz % wskaźnik poprawności przewidywania zdarzenia. Analiza pozwala również wykryć wpływ każdej ze zmiennych na prawdopodobieństwo wystąpienia zdarzenia i to, ile możemy się pomylić w szacowaniu. Do wizualizacji używa się wynalezionej podczas Drugiej Wojny Światowej krzywej ROC, za pomocą której szacowano naloty bombowe. Pole powierzchni pod krzywą wskazuje na siłę zmiennej wpływającej na pojawienie się zdarzenia. Na rysunku nr 1 przedstawiającym krzywe ROC widać że zmiana filtra oleju wpływa bardziej na awarię niż spóźnienie się z wymiana oleju. Płeć na szczęście nie wpływa na awarię.

Analiza regresji logistycznej jest bardzo często używana w problemach klasyfikacyjnych. Bardzo szczególnym problemem w którym analiza regresji logistycznej ma zastosowanie jest analiza i modelowanie ryzyka kredytowego. W tym kontekście modeluje się zmienne wejściowe, tworzy interakcje między nimi, a także tworzy się pochodne zmiennych w celu maksymalizowania prognozy tego czy ktoś spłaci kredyt/ pożyczkę lub nie. W tym przypadku analiza regresji logistycznej jest jedną z najbardziej skutecznych metod statystycznej analizy danych. Wiele symulacji oraz lata praktyki pozycjonują regresję logistyczną na pierwszym miejscu pod względem oceny jakości (widzianej z perspektywy zdolności modelu do separacji grup oraz stabilności jego szacowania). Regresję logistyczną wykorzystuje się również w badaniach i analizach medycznych (biostatystka). Jest ona doskonałą metodą wyjaśniającą i opisującą wpływ różnych zmiennych o stanie zdrowia pacjentów na występowanie różnych czynników chorobowych. Podobnie badacze wykorzystują regresję logistyczną w psychologii. Coraz częściej w publikacjach pojawiają się informacje na temat przewidywań zachowań ludzi opartych właśnie o prognozy z wykorzystaniem analizy regresji logistycznej. Test ten jest wspaniałym narzędziem do budowy zaawansowanych modeli wyjaśniająco klasyfikujących. Analiza ta nie jest skomplikowana w swej interpretacji oraz jest odporna na niespełnienie różnych założeń, które wymagają inne testy statystyczne (np. analiza dyskryminacyjna). Najważniejszą procedurą w kontekście tej analizy jest przygotowanie danych, przekształcenia, wybór odpowiednich zmiennych oraz diagnostyka modelu. To ona tych czynności zależy jakość wyników oszacowanych przez regresję logistyczną oraz ich stabilność oraz zdolność samego testu do uogólniania wiedzy na nowych danych. Bardzo gorąco polecamy tę procedurę, stosujemy ją od lat z sukcesem w analizach w kontekście medycyny, inżynierii, ekonometrii, psychometrii, pielęgniarstwie i coraz częściej w biznesie (firmy pożyczkowe, ubezpieczeniowe) i marketingu. Na życzenie jesteśmy przedstawić naszą autorską (lecz bardzo podobną w detalach) metodologię modelowania systemów klasyfikacyjnych opartych właśnie o oszacowania regresji logistycznej.

Jeśli chciałbyś przetestować możliwości tej wspaniałej procedury to się z nami skontaktuj. Opowiemy Ci jak jej użycie może wpłynąć na wnioski z Twojego badania, albo jak może to usprawnić działanie Twojego biznesu. W pierwszej kolejności możemy omówić Twój problem klasyfikacyjny i zaproponować możliwości aplikacji regresji logistycznej lub innej metody klasyfikacyjnych np. rozbudowanych drzew decyzyjnych lub analizy skupień. Wszystko zależy od tego z jakimi problemami mamy do czynienia. Nasz warsztat analityczny ma cały arsenał analiz statystycznych oraz metod opracowywania raportów i analiz statystycznych. Wszystko po to by poskromić każdy rodzaj danych. W szczególnych przypadkach jesteśmy wstanie sięgnąć po najnowsze i nieznane, a czasem niestandardowe rozwiązania. Poniżej prezentujemy skrótowy opis technik statystycznych wykorzystywanych poza regresją logistyczną. Być może, że któreś z tych podejść będzie bardziej odpowiadało na Twoje potrzeby i będzie bardziej dopasowane do problemów badawczych w kontekście tworzenia Twojej nauki lub rozwoju biznesu.

Zachęcamy do zapoznania się z naszym warsztatem.

Visual DNA – Psychologia osobowości w Biznesie.

Metodolog.pl – Analiza Statystyczna w nauce

Firma statystyczna METODOLOG

Dziś Metodolog.pl przedstawia Państwu psychologiczny wynalazek pochodzący z Wielkiej Brytanii.

https://www.visualdna.com/

Jest to firma dostarczająca psychometryczny wynalazek, który za pomocą obrazkowego testu statystycznie szacuje umiejscowienie badanego na 5 wymiarach osobowości. Dzięki takiej maszynerii można określić ryzyko spłaty zobowiązania kredytowego.

Dostawca tego typu statystyczno psychologicznego rozwiązania mówi o bardzo ważnej rzeczy. Mianowicie nie każdy ma punktację SCORINGOWą, ale każdy ma osobowość.  Jak wiemy ludzie, się różnią potencjałem osobowościowym 🙂

 

VisualDNA dostarcza informacje na temat powiązania osobowości ludzkiej z finansowymi zachowaniami.

Ponad to VisualDNA  dostarcza swoim psychologicznym narzędziem spojrzenie 360 na klientów firm. Dzięki temu dana firma doskonale wie o wzorcu zachowań swoich klientów i może w ten sposób umożliwić lepszą ich obsługę, co oczywiście przekłada się na  przyrost korzyści w biznesie.

Poniżej znajdują się  screeny testu wytworzonego przez naukowców i statystyków z VisualDNA.

quizz visual DNA visual DNA quizz 2 statysyka psychologiczna

Statystyczna siła efektu

Metodologia Badań

meto1

Środkiem do poznania prawdy naukowej lub biznesowej jest nienaganna metodologia badań

Badania to proces bardzo kosztowny i wymagający najwyższych lotów kompetencji, dlatego potrzebne jest bardzo dobre przygotowanie. Zazwyczaj, żeby móc zaprojektować doskonałe badanie, trzeba poświęcić trochę czasu na czytanie teorii i doniesień  naukowych bądź biznesowych z różnych, często rozbieżnych, źródeł. By poznać logikę lub funkcję problemu albo zjawiska, trzeba zastosować odpowiednie metodologie badawcze, bardzo wysublimowane i niekiedy podparte linią badań pilotażowych. Tylko odpowiednia, wręcz skrojona na miarę, metodologia badań daje szczegółowy wgląd w zjawisko. Dlatego dobra metodologia powinna się charakteryzować 5 cechami, widzianymi z perspektywy poznania prawdy naukowej czy biznesowej. Te cechy to:


1) ogólność


2) ścisłość


3) wysoka zawartość informacyjna


4) pewność


5) prostota!


Podejście takie daje możliwość najtańszego i najszybszego odkrycia interesującej nas prawdy naukowej

Jak pracuję w tym kontekście ?

+ Poznajemy się


+  Ustalamy kwestie formalne wraz z odpowiednimi umowami

– dzieło/zlecenie/prawa autorskie

– umowa tajności/poufności


+ Formułujemy problem badawczy oraz stawiamy hipotezy

– w tym etapie najważniejsze jest zdefiniowanie problemu, wraz ze wszystkimi możliwymi szczegółami.

– niekiedy nie wiemy jaki jest problem, ale chcemy znaleźć się w kontekście stanu pożądanego.

– określamy to czego chcemy.


+ Określamy uniwersum/przestrzeni zmiennych wyjaśniających istotnych z perspektywy zmiennej wyjaśnianej oraz dbamy o kontrole zmiennych ważnych z punktu widzenia warunków brzegowych

– na ten etap składa się praca nad ustaleniem tego, co wpływa na badane zjawisko oraz ustalenie warunków ubocznych, które mogą być dodatkowym źródłem zmienności wyników.


+ Przeprowadzenie badań pilotażowych

– jeśli materiały wymagane do konstrukcji badania są niezbędne lub nieznane trzeba je wytworzyć i zadbać o ich odpowiednie właściwości


+Operacjonalizujemy zmienne

– jest to przełożenie języka teoretycznego na język obserwacyjny, wyrażony w logice lub liczbach (jest to procedura wiązania pojęć teoretycznych z obserowowanymi wskaźnikami)

  polega również na użyciu odpowiednich materiałów bodźcowych lub/i narzędzi pomiarowych


+ Dobór modelu badawczego

– model eksperymentalny polegający na manipulowaniu zmiennymi, w celu wywołania pożądanego efektu. 

– model korelacyjny polegający na sprawdzeniu współwystępowania zjawisk


+ Dobór odpowiedniej i odpowiednio liczebnej próby badawczej

– losowa próba populacji jest istotnym z perspektywy uzyskania pożądanych wyników aspektem

– to z niej wyprowadza się problem, procedurę weryfikacji oraz wnioskowanie – inne sposoby doboru obserwacji do badania mogą odbić się mniejszym bądź większym obciążeniem wyników


+Wybór modelu statystycznego

– wybór odpowiednich metod weryfikacji statystycznej

– zbudowanie modelu statystycznego pod dane wejściowe

– testowanie różnych metod oszacowania pożądanego wyniku


+  Akceptacja wyników lub ich odrzucenie


+ Ocena, opis oraz interpretacja wyjaśniająca wraz ze specyfikacją lub generalizacją wyników.

– opis przeprowadzonego badania

– zakres pola aplikacji wyników

– krytyczna ocena trafności wewnętrznej (dokładności ) i zewnętrznej (uogólnienia) wyników badania

  krytyczna ocena czynności badawczych

– propozycja nowych perspektyw


 

mgr Konrad Hryniewicz

mgr Konrad Hryniewicz

 

Analiza statystyczna w psychometrii

Psychometria

meto

 

W sprawach psychometrii i teorii testów preferujemy kontakt telefoniczny.

Każda dziedzina nauki dała ludzkości coś wielkiego. Dawała i wciąż daje, choć aktualnie przyjmuje to trochę inny charakter, a mianowicie główne dziedziny rozpraszają się w coraz to nowsze i węższe specjalizacje. Te wielkie rzeczy łączyło to, że dbały o największe dobro- poprawiając bezpieczeństwo albo jakość życia. Podarowane zostało ludziom również wiele praktycznych wynalazków, które zaczęły być przez nich wykorzystywane na wielką skalę. Przykłady można mnożyć, są nimi między innymi:

– biologia – DNA (Watson i Cric 1853)

– medycyna – Antybiotyki i Szczepionki + drastyczne wydłużenie życia (Alexander Flemming 1928)

– inżynieria – Samolot (Bracia Wright 1903)

– fizyka – Energia Atomowa

– chemia – Nawozy Sztuczne (Carl Bosh i Fritz Haber 1927)

– biotechnologia – Inżynieria genetyczna i zapłodnienie in vitro

– socjologia – metody zwiększające zatrudnienie socjologów na rynku pracy

– projektowanie – Ferrari, Lamborgini, Audi

– marketing – Iphone

Ważne miejsce w tym rankingu zajmuje również psychologia – Testy psychologiczne i przewidywanie zachowania ludzi, jest to największe dobro stworzone przez psychologów.

Wprowadzenie.

Testy psychologiczne należą do najczęściej stosowanych przez psychologów narzędzi pomiarowych. Budzą też – także wśród samych psychologów – skrajne opinie. Złą sławą cieszą się, przede wszystkim, testy inteligencji. Ich konstruktorzy i użytkownicy są krytykowani ( głównie przez osoby nie do końca  obeznane z metodą psychometryczną ). Tak jak wszystko co nas otacza, tak i testy psychologiczne mają zarówno swoich zagorzałych zwolenników jak i przeciwników. Uważa się dziś, że po latach rozwoju technologii testów psychologicznych nie ma podstaw do odrzucenia tych specyficznych narzędzi pomiarowych. Trzeba natomiast eliminować z obiegu złe testy, czy wytwory działalności pseudopscyhometrów, którzy bez opamiętania produkują różne „potworki” lub „hybrydy”, udające prawdziwe testy psychologiczne. Często biorąc za nie duże pieniądze. Interpretacji testów, w sytuacji diagnostycznej, powinien dokonywać psycholog. Wykwalifikowany psycholog interpretuje wynik testowy, który jest wkomponowany w określoną teorię psychologiczną, która legła u podstaw konstrukcji testu oraz, która zakreśla ramy interpretacyjne wyniku. Niemniej jednak w skali przemysłowej do sytuacji diagnostycznej wcale nie musi dochodzić. Naszym celem jest niekiedy ilościowa klasyfikacja osób.

Po co wykonuje sie test ?

Testy są instrumentami służącymi do zbierania informacji, o człowieku, niezbędnych do pomiaru psychologicznego.

Diagnoza jest procesem zbierania danych, niezbędnych do podjęcia działań, których celem jest zmiana aktualnego działania ludzi (terapia, porada, interwencja, decyzja administracyjna)

Co test mierzy ?

Testy są metodami zbierającymi dane o różnicach w zachowaniu ludzi oraz stałość czasową i międzysytuacjyną zachowań pojedynczych osób.

Czym jest test ?

Zbiór zadań lub pytań – w standardowych warunkach (identycznych dla każdego testowanego) wywołujących określone rodzaje zachowań, które można zebrać w postaci wskaźnika liczbowego. Pomiar ten musi charakteryzować się pożądanymi wartościami psychometrycznymi, takimi jak wysoka rzetelność i wysoka trafność.

Elementarne składniki testu:

– pozycje testowe

– procedura przeprowadzania testu

– skala – pozwalająca ocenić wywołane reakcje, które są pochodnymi cechy, na skali ilościowej lub jakościowej

– reguły dochodzenia do wyniku testu oraz ocena wiarygodności tego wyniku – nasilenie danej cechy u danego człowieka oraz dobroć pomiaru testem.

Cechy testu

Rzetelność – na potrzeby testu opracowano materiały testowe i procedury badania, które maksymalizują dokładność pomiaru cechy badanej przez test.

Trafność – na potrzeby testu opracowano materiały testowe i procedury, które maksymalizują stopień w jakim test mierzy docelową cechę.

Zalety i wady testów:

Testy „reprezentują najbardziej wartościową i sprawiedliwą technologię, umożliwiającą podejmowanie wielu ważnych decyzji o ludziach”, ale jednocześnie „testowanie psychologiczne jest bardzo kontrowersyjne” (Murphy i Davidshofer, 1989, s. 2).

Testy– potrzeby rynku, oczekiwania klientów

Wg Sternberga (1992) i Morelanda (1995) oraz Standardów APA (1985), współczesny klient – przekonany o społecznej zasadności testowania – chciałby, aby testy psychologiczne gwarantowały:

– przewidywanie zachowań

– małą zmienność otrzymywanych wyników,

– normalizację wyników

– standaryzację procedury testowej

– prostotę stosowalności i interpretacji

– łatwość dochodzenia do wyniku

– obiektywną punktacj wyników

  szerokie spektrum stosowalności,

Pojęcie cechy

Cecha – zmienna osobowa, która wykazuje międzyosobniczą zmienność i wewnątrzosobniczą stałość (czasową i sytuacyjną).

Założenie o normalności rozkładu cech.

Zakłada się, że cechy psychologiczne mają rozkład normalny w populacji (tak jak wzrost, długość ręki, tętno, rozmiar stopy, niedopieszczane wyniki matur).  Na tej podstawie wyciąga się wnioski, o tym, że krzywa normalna jest modelowym rozkładem wyników testu.

Żeby skonstruować psychometryczną linijkę trzeba użyć do tego pozycji testowych, które są wyraźnie nacechowane i w jednakowym stopniu powiązane z mierzoną cechą.

Dąży się do tego, aby pozycje diagnostyczne jak najbardziej różnicowały badanych pod względem reagowania , opisu zachowania lub przekonań.

Do budowy miary wykorzystuje się zmienność międzyosobniczą i stałość wewnątrz-osobniczą.

Każde oprzyrządowanie pomiarowe ma swój błąd. W przypadku testowania psychologicznego odpowiedź na daną pozycję może być odgadnięta lub przypadkowa. Dlatego wykorzystuje się do pomiaru od kilku do kilkunastu, zazwyczaj, pozycji testowych.

Współwystępowanie zachowań.

Cecha jest ukrytą i stałą własnością funkcjonowania człowieka, której ekspresją obserwowaną jest zachowanie. Na podstawie znajomości  cech można przewidywać potencjalne zachowania, które wychodzą poza pole zachowań mierzonych przez test.

Cechą definiuje się właściwości determinujące współwystępowanie pewnej puli zachowań.  np. ekstrawersja łączy w sobie towarzyskość, emocjonalność, ilość znajomych, pobudzenie, reagowanie na nagrodę/karę, uczenie się, spędzanie wolnego czasu, zadowolenie z życia itd.

Pojedyncze zachowanie bywa ekspresją wielu cech, ale kombinacja wielu zachowań jednoznacznie określa poziom nasilenia danej cechy.

Właściwości testu zależą bezpośrednio od wyników poszczególnych pozycji (oraz ich wzajemnej korelacji)

Rzetelność testu.

błąd pomiaru = odchylenie standardowe √(1 – dokładność pomiarowa skali)

Potocznie rzetelność znaczy niezawodność/dokładność pomiaru. W psychometrii rzetelność jest to powtarzalność wyników otrzymywanych przy pomiarze tym samym testem, w tych samych warunkach badania. Ponieważ wielokrotne (nieskończone) badanie tym samym testem jednej osoby nie jest możliwe, to błąd pomiaru jest szacowany na podstawie rozkładu błędów pomiaru licznych (ale różnych) osób badanych. W ramach Klasycznej Teorii Testów standardowy błąd pomiaru definiuje przedział, w jakim znajduje się prawdziwy wynik osoby badanej. Błąd ten jest identyczny dla wszystkich osób badanych i dla wszystkich wyników otrzymanych. Jest on silnie związany z rzetelnością (tak jak dokładność z jaką laser lub metoda CNC wycina formę w metalach, zawsze jakaś nieidealność będzie istnieć). W naszej koncepcji jest to bardzo ważne. Wartość rzetelności przyjmuje wartości od 0 do 1. Im bliżej 1 tym błąd pomiaru jest mniejszy. Oznacza to, że wynik zależy bardziej od właściwości pozycji testowych niż od innych czynników. Gdyby rzetelność wynosiła 1 to wynik otrzymany w teście był by wynikiem prawdziwym. Jest to jednak sytuacja modelowa, rzetelność zwykle jest mniejsza od 1 i dlatego w diagnozie, poziom cechy szacuje się w określonym przedziale ufności, z określonym prawdopodobieństwem. Jednak tylko przy diagnozie indywidualnej. W swej logice obliczeniowej miara ta określa, na ile pozycje wchodzące w skład danego wymiaru osobowości są do siebie podobne i czy badają to samo zjawisko. Krótko mówiąc, określa to jaka jest zgodność odpowiedzi badanych na pozycje testowe. Jeśli zaznaczają jedną odpowiedz, to zaznaczają też inne podobne do tych odpowiedzi.

Trafność pomiaru testowego.

Zbadanie trafności odpowiada na pytania:

– co test mierzy i jak dobrze to robi ?

– czy dana skala odpowiada celom jego użytkownika ?

– jakie jest pole stosowania testu ?

Szacowanie trafności jest nazywane walidacją, która jest niekończącą się historią. Im więcej badań tym więcej informacji na temat działania skali i jej potencjału aplikowalności.

Konstruowanie – etapy opracowywanie testu.

– konceptualizacja tego, co ma być mierzone

– operacjonalizacja (jest to procedura wiązania pojęć teoretycznych z obserowowanymi wskaźnikami). Określenie puli pozycji testowych, które będą wskaźnikami mierzonej cechy

– określenie formatu pozycji i gradacji

– zgromadzenie dużej puli pozycji testowych.

– badanie

– analiza statystyczna

– zbudowanie wyjściowej wersji testu.

– manual (podręcznik obsługi z odpowiednimi normami)


Firma statystyczna specjalista statystyk analiza danych

Badania naukowe online

Uruchomiliśmy dla Was nową funkcjonalność w postaci ANKIET ON-LINE.

Dzięki naszej profesjonalnej pomocy będziesz mógł stworzyć kwestionariusz, test lub ankietę online.


Nie musicie już robić tego sami. Każdą papierową ankietę zamienimy Wam na ankietę elektroniczną i wyślemy do niej link. Każdy kto w niego kliknie będzie mógł pomóc w Waszej pracy naukowej i stać się osobą badaną.


NIE MA ŻADNYCH OGRANICZEŃ W POSTACI:

  • ILOŚCI PYTAŃ
  • SKAL POMIAROWYCH
  • ILOŚCI BADANYCH
  • WIELKOŚCI BAZY DANYCH

Ponadto jeśli sami tworzycie Wasze narzędzie badawcze, otrzymujecie od Nas darmową opiekę merytoryczną w zakresie metodologii badań. Pomożemy Wam dobrać odpowiednie skale pomiarowe, podpowiemy jak liczna powinna być badana grupa i wiele więcej!


OSTATECZNIE W WYNIKU PRZEPROWADZONEGO BADANIA OTRZYMUJECIE OD NAS BAZĘ DANYCH GOTOWĄ DO PRZEPROWADZENIA NA NIEJ ANALIZ STATYSTYCZNYCH.


Potencjał naszych elektronicznych ankiet:


– nieograniczony zasięg


– możliwość ustawienia tokenów ( zapobieganie kilkukrotnemu badaniu tej samej osoby)


– losowanie warunków badawczych


– pełna synchronizacja social media


– możliwość instalacji różnych multimediów w ankietę (dźwięk, obraz, film (youtube))


– kontrola czasu odpowiedzi


– podstawowe raportowanie w postaci statystyk opisowych i częstości


– osobisty dostęp do prywatnego panelu


Ankiety są tworzone w systemie LimeSurvey.


Lime survey ankiety on line