analiza statystyczna metodolog

Jak skonstruować dobry test psychometryczny tips&tricks

Jak skonstruować dobry test psychometryczny tips&tricks Metodolog.pl

Można powiedzieć, że test psychologiczny jest narzędziem, które:

(1) pozwala na uzyskanie takiej próbki zachowań, o których można przyjąć (np. na podstawcie założeń teoretycznych), że są one wskaźnikami interesującej nas cechy psychologicznej. Zachowania te nie muszą ściśle przypominać tych, które chcemy oszacować na podstawie testu. Wystarczy wykazać, że istnieje między nimi określony związek;

(2) dostarcza reguł obliczania wartości mierzonej cechy;

(3) spełnia określone kryteria formalne, takie jak: obiektywność (czyli niezależność wyników testowania), standaryzacja (czyli jednolitość reguł badania testem), rzetelność (czyli dokładność pomiaru), trafność (czyli ustalenie, że test mierzy właśnie to, co z założenia powinien mierzyć) i normalizacja (czyli określenie reguł interpretacji wyniku testowego)

(4) jasno określa zakres i rodzaj dopuszczalnych zachowań ze strony diagnosty, zakładając kooperacyjną postawę osoby badanej.

 

Charakterystyka statystyczna pozycji, które powinny być włączone do testu

(1) Średnia pozycji nie powinna osiągać wartości ekstremalnej w danej skali punktacji. Pozycja taka oznacza bowiem, że wszystkie osoby badane osiągnęły ten sam wynik. Nie wnosi więc ona żadnego wkładu w obserwowane różnice międzyosobnicze. Optymalna pozycja powinna zatem mieć średnią, „ulokowaną” idealnie w środku danej skali pomiarowej, na przykład przy kodowaniu „zero-jedynkowym” powinna być równa 0,50. W testach zdolności, z uwagi na silne skorelowanie pozycji, które prowadziłoby do uzyskiwania rozkładów platykurtycznych (o zbyt niskiej kurtozie; zob. Blalock, 1977), wprowadza się pozycje o zróżnicowanej średniej, to znaczy odpowiadające wzrastającemu poziomowi trudności pozycji.

(2) Wariancja pozycji nie powinna być równa zero. Pozycja taka bowiem nie wnosi żadnego wkładu w obserwowane różnice międzyosobnicze. Optymalna pozycja powinna zatem mieć dużą wariancję wyników. Przykładowo: maksymalna wariancja wyników pozycji jest rejestrowana przy „zero-jedynkowym” systemie punktacji dla średniej 0,50 i wynosi wtedy 0,25, co jest maksymalnie możliwym do uzyskania wynikiem.

(3) Pozycja powinna wykazywać dodatnie skorelowanie z innymi pozycjami. Przy korelacji równej zero pozycja ta zwiększa wariancję wyników testu, ale jedynie o wartość własnej wariancji. Jeśli jednak nie koreluje z innymi pozycjami, to znaczy, że nie mierzy tego, co one, oraz nie generuje kowariancji, a dokładniej – generuje zerowe kowariancje. Przy korelacji ujemnej pozycja z kolei także zwiększa wariancję wyników testu jako całości o swoją wariancję, ale generuje ujemne kowariancje z innymi pozycjami. Całkowita wariancja testu po dodaniu takiej pozycji wręcz maleje, co w oczywisty sposób jest sprzeczne z założeniami testu, który powinien ujawniać znaczne różnice międzyosobnicze. Interkorelacje pozycji z innymi pozycjami powinny być zatem dodatnie, tylko bowiem w tym wypadku maksymalizowana jest wariancja wyników testu jako całości. Optymalne pozycje nie powinny jednak wykazywać zbyt silnego skorelowania z innymi pozycjami (co jest zresztą przypadkiem raczej teoretycznym), ponieważ zbyt duża zgodność odpowiedzi może prowadzić do uzyskania rozkładów platykurtycznych wyniku testu.

 

Relacja między rzetelnością a trafnością pomiaru cechy testem

Rzetelność i trafność są dwoma parametrami psychometrycznymi pomiaru danej cechy testem. Wykazują także zbliżone uwarunkowania – zależą od charakterystyki testu (długość i interkorelacje pozycji testowych ) oraz zmienności w badanej próbie. Ograniczenie zmienności powoduje obniżanie się zarówno rzetelności, jak i trafności pomiaru. Trafność pomiaru jest jednak bardziej „wrażliwa” na zmiany procedury badania testem, na przykład zmiana warunków badania może skutkować nie tyle obniżeniem rzetelności, ile trafności pomiaru testem w konsekwencji badania innej zmiennej psychologicznej. jak przykładowo tendencji do dysymulowania. Pomiar jest wówczas rzetelny, ale nietrafny. Rozumowanie to prowadzi nas do wskazania istotnych relacji między rzetelnością a trafnością pomiaru. Utwierdzenia, że ogólnie rzetelność jest koniecznym, ale niewystaczającym warunkiem trafności pomiaru (rzetelność stanowi bowiem kres trafności pomiaru) Test może zatem oferować rzetelny i mało trafny pomiar, ale niemożliwa jest sytuacja odwrotna – testo o mało rzetelnym pomiarze będzie także testem mało trafnym, a test oferujący pomiar o dużej trafności automatycznie musi być testem o dużej rzetelności.

Czynniki wpływające na wielkość współczynników rzetelności pomiaru testem

Na rzetelność pomiaru, rozumianą jako zgodność wewnętrzna, wpływają dwa główne czynniku zakres zmienności w badanej próbie oraz charakterystyki testu, czyli jego długość i wielkość skorelowania pozycji. Współczynnik rzewności oznacza rzetelność pomiaru różnic interindywidualnych w zakresie cechy. Z tego względu ograniczenie zmienności wyników w badanej próbie skutkuje niższą rzetelnością pomiaru cechy, na przykład w grupach jednorodnych demograficznie współczynniki zgodności wewnętrznej są często niższe niż w całej próbie zróżnicowanej demograficznie. Wariancja prawdziwa jest definiowana poprzez kowariancję wyników pozycji, toteż większą rzetelnością pomiaru charakteryzują się testy zawierające większą liczbę pozycji (ze względu na większą liczbę wyrażeń kowariancyjnych pozycji oraz testy, których pozycje są wyżej skorelowane (z uwagi na wielkość wyrażeń kowariancyjnych. Zwiększenie rzetelności pomiaru – jak wskazuje wzór Spearmana-Browna – może zatem odbyć się poprzez wydłużenie testu,  poprzez wprowadzenie do testu pozycji wysoko wzajemnie skorelowanych.

 

Zalecenia dotyczące opcji odpowiedzi w kwestionariuszach

W wypadku metod kwestionariuszowych sugeruje się zastosowanie raczej rozszerzonych formatów odpowiedzi a więc zawierających kilka (więcej niż dwie) opcji odpowiedzi. Formaty nie powinny jednak być nadmiernie szeroki oraz zawierać opcji pośredniej, wskazującej na niepewność osoby badanej (na przykład „Nie wiem” czy znaku zapytania [„?”]). Opcja centralna może być jednak uwzględniona, gdy oznacza przeciętne nasilenie zachowania. Optymalna liczba powinna wynosić od 4 do 7 opcji odpowiedzi, przy czym najlepiej, jeśli byłyby one wyrażone w formie akceptacji-dezakceptacji treści pozycji i nie zawierały opisów częstości czy intensywności zachowania (chyba że wymaga tego badany konstrukt teoretyczny). Inna kwestia dotyczy zakotwiczenia skali odpowiedzi, która powinna obejmować kategorie niemalże ekstremalne, rozszerzające poznawczo zakres analizowanych przez osobę badaną zachowań. kierunek zakotwiczenia zaś powinien przebiegać od opcji negatywnych do afirmatywnych, na przykład od „Zdecydowany nie zgadzam się” do „Zdecydowanie zgadzam się” . Ponadto powinny one być językowo proste i dostosowane do treści pozycji oraz preferencji osób badanych, co można ustalić w badaniach pilotażowych (Angleitner i in. 1986). Użytecznym rozwiązaniem jest także stosowanie określeń werbalnych (w formie gradacji stopnia akceptacji-dezakceptacji treści pozycji) wraz z przyporządkowanymi im wartościami liczbowymi. Kanonem jest ponadto wprowadzenie opcji o jednolitym formacie dla wszystkich pozycji, w przeciwnym razie zróżnicowanie szerokości formatu skutkuje zróżnicowaniem wag pozycji.

Sprzeczność między trafnością teoretyczną a kryterialną pomiaru cechy testem

Koncepcja cechy wymaga wprowadzenia do testu odmiennych treściowo, ale skorelowanych pozycji. Wybór pozycji wysoko wzajemnie skorelowanych powoduje jednak, że charakteryzują się one dużym podobieństwem treściowym. Rodzi to sprzeczność między teoretyczną „szerokością” definiowania cechy a możliwością jej raczej „wąskiego” zoperacjonalizowania w praktyce. Przyjmując też, że skorelowanie pozycji maleje wraz ze zmniejszaniem się podobieństwa treściowego, warunkuje to także sprzeczność między precyzją pomiaru (rzetelnością) a zakresem wskaźników cechy, obejmowanym przez test. W wypadku bowiem, gdy test zawiera pozycje podobne treściowo, to pomiar cechy jest bardzo rzetelny, ale cecha jest „wąsko zoperacjonalizowana”. Natomiast gdy cecha jest „zoperacjonalizowana szeroko”, to test obejmuje pozycje odmienne treściowo i słabo skorelowane, wskutek czego pomiar cechy jest mało rzetelny (zob. Murphy i Davidshofer, 2005). Paradoks ten powoduje też istnienie sprzeczności między trafnością teoretyczną a kryterialną zarówno pozycji testowych, jak i testu jako całości. W pierwszym wypadku bowiem cecha jest ujmowana precyzyjnie, a test charakteryzuje duża trafność teoretyczna pomiaru, ale słaba trafność kryterialna – badana cecha wyjaśnia w niewielkim stopniu złożone zachowania w naturalnych sytuacjach. W drugim zaś – badana cecha wyjaśnia wiele zmienności kryterium, ale wskutek wewnętrznej niejednorodności pozycji pomiar testowy jest mało trafny teoretycznie, a badana cecha treściowo niejednoznaczna. Rozwój teorii różnic indywidualnych, diagnostyki psychologicznej oraz psychometrii spowodował jednak, że psychologowie z reguły opowiadają się za pierwszą z tych możliwości, preferując konstruowanie testów o dużej trafności teoretycznej.

 

Chcesz zobaczyć jak wygląda prawdziwy test psychologiczny, kwestionariusz osobowości? Sprawdź http://www.testmirror.pl

Przykładowy raport testu osobowości, test osobowości, wyniki testu osobowości

OFERTA NARZĘDZIA DIAGNOSTYCZNEGO – Test Mirror

Przedmiotem oferty jest sprzedaż kodów dostępu do testu Mirror, które mogą Państwo wykorzystać m.in. dla celów osobistych, w pracy z szeroko pojętymi klientami i/lub podczas rekrutacji pracowników.

Test jest związany z profesjonalną i kompleksową diagnozą osobowości i doradztwa na wielu poziomach. Test został zbudowany pod nadzorem psychologów-naukowców i spełnia wymogi psychometryczne- pomiar psychologiczny testem Mirror jest rzetelny, trafny oraz pozwala na ufność w stosunku do otrzymanego wyniku.

OFERTA NARZĘDZIA DIAGNOSTYCZNEGO MIRROR 

analiza statystyczna, obliczenia, usługi statystyczne, obliczenia, statystyka, Metodolog.pl

Test Mirror – Diagnoza osobowości powiązana z doradztwem. Metodolog.pl

Pragniemy by ludzie mieli możliwość rozwijania tego, co w nich najcenniejsze – swojej indywidualności” – Konrad Hryniewicz wraz z zespołem.

psychologiczny naukowy test osobowości Mirrr

Diagnoza osobowości  i doradztwo – www.testmirror.pl

Osobowość a zadowolenie z pracy.

            Dowodzenie źródeł satysfakcji z pracy ma długą tradycję i historię w badaniach pracowników. Już w 1935 roku Hoppock odnotował powiązanie pomiędzy emocjonalnym dostosowaniem pracowników a poziomem zadowolenia z pracy. Podobnie, Fisher i Hanna (1931) na podstawie obserwacji stwierdzili, że szeroki zakres niezadowolenia z pracy wynika z emocjonalnego niezrównoważenia. Przez wiele lat rozważania na temat dyspozycyjnych źródeł zadowolenia z pracy były uśpione z pewnymi mniejszymi lub większymi wyjątkami. Jadnakże,w ostatnich latach rozwijana literatura na ten temat wsparła argument, że zadowolenie jest częściowo oparte o dyspozycje osobowościowe (House, Shane, & Herold, 1996). Niemniej ze względu na szeroką akceptację opisanego podejścia  Spector (1997) napisał, że „Pomimo wielu cech mających powiązanie z zadowoleniem z pracy, większość badań nad osobowością nie pokazuje nic więcej niż proste korelacje bez oferowania większych teoretycznych wyjaśnień”. W ostatnich 20 latach zgoda co do modelu teoretycznego wyłoniła się wraz pojawieniem się modelu pięcioczynnikowego osobowości (Goldbeg 1990), często nazywanego Wielką Piątką (ang. Big Five), który może być używany do opisania najistotniejszych aspektów osobowości. Pomimo, że ów model był używany w wielu badaniach przemysłowo-organizacyjnej psychologii, zwłaszcza w odniesieniu do jakości wykonywanej pracy, to relacja Wielkiej Piątki do zadowolenia z pracy jest mniej zbadana. W tej dziedzinie ważną pracą jest metaanaliza opublikowana przez Timothiego A, Judga, Daniela Hellera oraz Mechaela K. Mounta (2002). Podsumowuje ona jasno i bardzo precyzyjnie relację między cechami osobowości a zadowoleniem z pracy. Na podstawie 334 współczynników korelacji z 163 badań autorzy wskazują, że wartości prawdziwe współczynników korelacji cech z zadowoleniem z pracy wynoszą: -0,29 dla neurotyczności; 0,25 dla ekstrawersji; 0,02 dla otwartości na doświadczenia; 0,17 dla ugodowości oraz 0,26 dla sumienności z czego cały model predykcyjny wyjaśniał 41% zadowolenia.

            Można śmiało powiedzieć, że nasze samopoczucie z realizowanej pracy w prawie połowie zależy od tego jakie są osobiste dyspozycje człowieka zdefiniowane tylko na 5 wymiarach. Dodajmy do tego dodatkowe trzy cechy osobowości takie jak materializm, poszukiwanie doznań oraz poczucie umiejscowienia kontroli, które są oferowane przez Mirror, a spokojnie  przejdziemy z 41% do ponad 50% wyjaśnionej wariancji zadowolenia z wykonywanej pracy (pod warunkiem dopasowania do niej, ale o tym później). Pomimo, że cechy osobowości Wielkiej Piątki są powszechnie znane w kontekście predykcji zadowolenia to niestety dodatkowe 3 cechy diagnozowane przez Mirror mogą już takich właściwości nie mieć. Do testu dobrano dodatkowe 3 wymiary które uzupełniają obraz osobowości oraz odgrywają silną rolę w doradztwie, czyli drugim – poza diagnozą – aspektem testu Mirror.

            Pierwszą cechą testu Mirror wykraczającą poza Big Five jest konstrukt materializmu,  który jest dosyć nowo poznanym wymiarem (Richins & Dawson 1992). Badacze traktowali materializm jako  wartość, która wpływa na kierunek w którym ludzie definiują swoje środowisko i własne życie. Określali to jako wartości przypisywane posiadaniu i nabywaniu materialnych dóbr w osiąganiu głównych celów życiowych lub pożądanych stanów. Konceptualizowali wyznawane przez ludzi wartości materialne jako obejmujące trzy domeny: wykorzystywanie majątku w celu oceny powodzenia innych i siebie, centralności posiadania majątku w życiu człowieka, i wiary w to, że posiadanie i nabywanie prowadzi do zadowolenia i satysfakcji z życia.      Kolejną cechą jest poszukiwanie doznań,  zdefiniowane i szeroko opisane przez Marvina Zuckermana (1979) jako poszukiwanie zróżnicowanych, nowych, złożonych i intensywnych wrażeń i doświadczeń oraz gotowość do podejmowania ryzyka fizycznego, społecznego, prawnego i finansowego w celu dostarczenia sobie tego typu doświadczeń.

            Ostatnią cechą jaką włączyliśmy do zestawu testowego jest wymiar poczucia umiejscowienia kontroli opracowany przez Juliana Rottera (1966). Który jest konceptualizowany w niezmienionej formie jako to, że poczucie sprawstwa człowieka jest subiektywnie ulokowane. Twierdził on, że ludzie uczą się w ciągu swojego rozwoju osobniczego wierzyć, że ich losem i napotkanymi wydarzeniami kierują oni sami, bądź też, że kierują nimi czynniki i siły niezależne od nich, na które nie mają żadnego wpływu. W związku z tym teoria Rottera umieszcza ludzi na jednym kontinuum psychologicznym na którego przeciwnych końcach jest nasilenie zewnętrznego oraz wewnętrznego poczucia umiejscowienia kontroli.

            Podsumowując doniesienia z badań i bardzo silne intuicje dotyczące pozostałych cech (pod warunkiem dopasowania behawioru do warunków organizacyjnych i wymagań pracy) można z całą odpowiedzialnością powiedzieć, że mamy do czynienia z fenomenem polegającym na tym, że od właściwości psychologicznych człowieka zależy w połowie jego zadowolenie z pracy. Od czego w takim razie zależy reszta zadowolenia?

Dopasowanie między osobą – organizacją i środowiskiem pracy.

            Ostatnie meta-analityczne odkrycia w literaturze identyfikują to, że dopasowanie osoby do organizacji w której pracuje (ang. P-O fit) jest pozytywnie związane z jej zachowaniem (np. im osoba była bardziej dopasowana tym wykonywanie zadań i obowiązków jest na wyższym poziomie r=0,28, częściej przejawiają się obywatelskie zachowania organizacyjne r=0,26; Hoffman & Woeher, 2006) oraz to, że osoby dopasowane do organizacji osiągają wyższy poziom zaangażowania po przyjęciu do pracy (r=0,27; Kristof-Brown i inni., 2005). Pan Schneider (1987) dostarcza teoretycznego wyjaśnienia tego faktu i opisuje to tak, że kandydaci do preferowanej pracy są zachęcani i wybierani przez daną firmę co przekłada się to na to, że typ wybranego pracownika zwiększa jednorodność kapitału ludzkiego w firmie w czasie trwania jej życia. Rozjaśniając tę kwestie można powiedzieć, że kiedy pracownicy mają wysoki poziom dopasowania do firmy, ich bardzo osobiste cele i wyobrażenia mogą być bardziej spójne z tymi oferowanymi przez środowisko pracy. W rezultacie organizacja może dostarczyć pracownikom okazji do zaspokojenia ich potrzeb, co przekłada się na zmniejszoną częstość pojawiania się stresorów (takich brak dopasowania własnej indywidualności do wymagań w miejscu pracy i niejasność odgrywanej roli pracowniczej (Parkington & Schneider, 1979). Co więcej, ludzie wysoce dopasowani do wymagań środowiska mogą  osiągać wyższe wyniki w pracy (Schneider, Kristof-Brown, Goldstein, & Smith, 1997).

            Czy jest coś jeszcze poza dopasowaniem człowieka do organizacji, co może wyjaśniać pozostałą porcję zadowolenia? Otóż kolejną koncepcją, która bezpośrednio odnosi się do osobowości i jej roli w wymaganiach środowiskowych jest koncepcja dopasowania na relacji osoba – środowisko (ang. Person – Enviroment Fit – PE Fit). Zgodnie z tą koncepcją w środowisko wlicza się charakterystykę pracy, zawód i organizację. W zależności od różnych koncepcji teoretycznych PE Fit – których jest bardzo wiele – można znaleźć cechy wspólne tych wszystkich podejść (Schneider, Goldstein, & Smith, 1995). Po pierwsze osoba i środowisko pracy muszą być rozpatrywane łącznie. Po drugie- są dwie kategorie zmiennych osobowych, które wiążą się z dwiema kategoriami zmiennych środowiska pracy. Kategoria pierwsza to wartości i potrzeby osoby wiążące się z kategoriami zasobów dostarczanych przez kontekst pracy. Druga kategoria to umiejętności i osobowość człowieka, które wiążą się z kategorią wymagań stawianych w miejscu pracy. Trzecia komponenta to obiektywne lub subiektywne ocenianie dopasowania (Pervin, 1968), przy  czym każda perspektywa dostarcza unikalnej informacji o powiązaniu człowiek-środowisko. Obiektywnie ktoś może zapoznać się z agregatem opinii o sobie od rówieśników i ekspertów (Hofstee, 1994), lecz subiektywnie osoba ta jest osadzona w osobistych ocenach siebie i własnych wartości. Obiektywne środowisko pracy może być oceniane przez każdego pracownika inaczej, a jeszcze inaczej ocena może wyglądać ze strony sędziów kompetentnych np. specjalistów HR.

            Na podstawie wcześniejszych twierdzeń teoretycznych można wysunąć wniosek, że jeśli osoba osiąga wysokie PE Fit to znaczy, że można domniemać o jej większej spójności w warunkach pracy. Podstawowym założeniem jest to, że kiedy istnieje korespondencja pomiędzy człowiekiem a jego środowiskiem mamy małą szansę na bolesne i trudne zmiany osobowości. Dla przykładu można wyobrazić sobie pracę o konkursowo-rywalizacyjnym charakterze (np. handlowiec), gdzie zatrudniona osoba ma mało ugodowy charakter i cechuje ją wysokie zrównoważenie emocjonalne. W takim układzie nie ma możliwości, aby doszło do pewnych negatywnych emocji związanych z presją wymagań środowiska pracy. Co innego, kiedy ktoś jest ekstrawertykiem poszukującym doznań. W takim wypadku można oczekiwać, że kariera w spokojnej bibliotece może skończyć się szybko i dramatycznie. Wiele perspektyw teoretycznych i dowodzeń empirycznych sugeruje, że sama osobowość ma wpływ na zadowolenie, a dodatkowo dopasowanie osoba – środowisko je wzmacnia. Dopasowanie odgrywa ważną rolę w rozwoju osobowości oraz promuje większą jej ciągłość i stabilność w czasie w przypadku wysokiego nasilenia dopasowania. Dzięki takiemu dopasowaniu w pracy częściej pojawiają się pozytywne emocje i występują większe szanse na spójny z sobą samym rozwój kariery zawodowej.

Czym jest Mirror?

            Diagnoza testem Mirror polaga na pomiarze opartym o wybór skrupulatnie przygotowanych – w serii badań pilotażowych – obrazków przedstawiających różne zachowania. Pomiar takim testem jest o wiele szybszy oraz atrakcyjniejszy niż w przypadku używania klasycznych testów typu papier-ołówek. W teście Mirror dostarczamy bezpośrednich informacji o powiązaniu osobowości człowieka z określonymi środowiskami pracy. Test dokonuje obiektywnego pomiaru zachowań wyrażonych w liczbach oraz doradztwa polegającego na predykcji statystycznej. Mechanika algorytmów używanych w teście jest osadzona na seriach badań, których celem było wiązanie obiektywnie mierzonych cech z subiektywną preferencją zawodów i aktywności w czasie wolnym.

            Ze względu na komercyjny charakter projektu nie możemy podać informacji o metodologii konstrukcji testu, toku podejmowanych decyzji oraz losowaniu obserwacji do badań. Niemniej przedstawiamy rezultaty w postaci właściwości psychometrycznych i predykcyjnych na stronie www.metodolog.pl. W skrócie jest to narzędzie o bardzo dokładnych właściwościach pomiarowych osobowości (współczynniki α Cronbacha przyjmowały wartości z przedziału 0,66-0,86, a średnio wynosiły one α =0,77) oraz bardzo zadowalających właściwościach predykcyjnych dotyczących poradnictwa (współczynniki wyjasnionej zmienności preferowania danych aktywności zawodowych i sposobu spędzania czasu wolnego przyjmowały wartości z przedziału 12-44%, a średnio wyjaśniały 23%). To oznacza, że cechy są bardzo silnymi czynnikami wpływającymi na preferencje zawodowe i chęć spędzania czasu wolnego w określony sposób. Podsumowując właściwości psychometryczne i statystyczne testu Mirror można (z całą pewnością i odpowiedzialnością za wyniki diagnoz) stwierdzić, że narzędzie Mirror jest ekwiwalentem naukowych testów klasycznych (korelacje pomiarów Mirrora z klasycznymi testami przyjmowały wartości z przedziału 0,76 do 0,89).

            Test Mirror jest narzędziem służącym do diagnozy osobowości w nowoczesny sposób na 8 skalach, takich jak wymiary: Ekstrawersji, Neurotyczności, Sumienności, Ugodowości, Otwartości na doświadczenia,  Poszukiwania Doznań, Poczucia Umiejscowienia Kontroli oraz Materializmu w zakresie klasyfikacji do 3 grup nasilenia wyników (wyniki obniżone/umiarkowane/podwyższone). Na podstawie informacji o nasileniu cech osobowości test dokonuje poradnictwa (dzięki systemowi IT) w kwestii korespondujących z osobowością obszarów aktywności zawodowych, sposobu spędzania czasu wolnego oraz informowania o ryzyku w sferze finansów i uszczerbku na zdrowiu. U podstaw konstrukcji testu Mirror legły podstawy teoretyczne i przesłanki empiryczne wymienione powyżej oraz to, że jako zespół psychologów naukowców pragnęliśmy aby ludzie mieli narzędzie, dzięki któremu będą mieć rzetelną podstawę do podjęcia decyzji o sobie w szerokim i bardzo cennym zakresie życia. Test Mirror ma być pomocą w podejmowaniu kroków co do rozwoju w zgodzie z cechami osobowości. Na podstawie długiej tradycji badawczej w kontekście różnic indywidualnych możemy przewidywać, że dopasowanie zróżnicowania cech do wymagań stawianych przez kontekst zawodowy oraz okazje dostarczane przez czas wolny od zobowiązań, będzie skutkował częstszym doświadczaniem pozytywnych emocji w związku z wykonywanymi czynnościami, łatwiejszym pokonywaniem bardziej przewidywalnych trudności oraz poprawą jakości życia.

Bibliografia:

Costa, P. T., Jr., & McCrae, R. R. (1992). Revised NEO Personality Inventory (NEO-PI-R) and NEO Five-Factor (NEO-FFI) Inventory professional manual. Odessa, FL: PAR.

Fisher, V. E., & Hanna, J. V. (1931). The dissatisfied worker. New York: Macmillan.

Goldberg, L. R. (1990). An alternative “description of personality”: The Big-Five factor structure. Journal of Personality and Social Psychology, 59, 1216–1229.

Hoffman, B. J., & Woehr, D. J. (2006). A quantitative review of the relationship between person- organization fit and behavioral outcomes. Journal of Vocational Behavior68, 389–399.

Hofstee, W. K. B. (1994). Who should own the definition of personality? European Journal of Personality, 8, 149–62.

Hoppock, R. (1935). Job satisfaction. New York: Harper.

House, R. J., Shane, S. A., & Herold, D. M. (1996). Rumors of the death of dispositional research are vastly exaggerated. Academy of Management Review, 21, 203–224.

Judge,  T,  A.,   Heller, D.,  Mount, M. K. (2002). Five-Factor Model of Personality and Job Satisfaction: A Meta-Analysis. Journal of Applied Psychology, Vol. 87, No. 3, 530–541

Kristof-Brown, A. L., Zimmerman, R. D., & Johnson, E. C. (2005). Consequences of individuals’ fit at work: A meta-analysis of person-job, person-organization, persongroup, and person-supervisor      fit. Personnel Psychology58, 281–344.

Parkington, J. P., & Schneider, B. (1979). Some correlates of experienced job stress: A boundary role study. Academy of Management Journal22, 270–281

Pervin, L. A. (1968). Performance and satisfaction as a function of individualenvironment fit. Psychological Bulletin, 69, 56–68.

Richins, Marsha L. and Scott Dawson (1992), “A Consumer Values Orientation for Materialism and Its Measurement: Scale De-velopment and Validation,” Journal of Consumer Research, 19    (December), 303–16.

Rotter, J., B. (1966). Generalized expectancies for internal versus external control if reinforcement. Psychological Monographs. General and Applied, Vol. 80, No. 1

Schneider, B. (1987). The people make the place. Personnel Psychology40, 437–453.

Schneider, B., Goldstein, H. W., & Smith, D. B. (1995). The ASA framework: An update. Personnel  Psychology, 48, 747–773.

Spector, P. E. (1997). Job satisfaction. Thousand Oaks, CA: Sage.

Zuckerman, M. (1979). Sensation Seeking: beyond the Optimal Level of Arousal. Hillsdale, NJ:    Lawrance ErlBaum Associates.

 

psychologiczny naukowy test osobowości Mirrr

Dokumentacja dotyczaca własciwości psychometrycznych, aspektów predykcyjnych i trafności klasyfikacyjnej mechaniki testu Mirror

założenia regresji logistycznej

W tym wpisie prezentujemy właściwości pomiarowe testu Mirror oraz potencjał predykcyjny dotyczący relacji cechy osobowości, a preferencja pracy, aktywności w czasie wolnym, kłopotów finansowych oraz tendencji wpadania w sytuacje urazowe.

Mamy nadzieję, że test Mirror będzie doskonale służyć w Państwa praktyce zawodowej oraz życiu osobistym.

 

Dokumentacja dotyczaca własciwości psychometrycznych, aspektów predyckyjnych i trafności klasyfikacyjnej mechaniki testu Mirror <- PDF z dokumentacją.

statystyka medyczna, biostatystyka

Klasyczne i nowoczesne teorie pomiaru, raportów o pacjentach i klinicznych wyników

Metodolog - statystyczna analiza data minig

Metodolog.pl – Analiza Statystyczna w nauce

Firma statystyczna METODOLOG

Klasyczne i nowoczesne teorie pomiaru, raportów o pacjentach i kliniczne wyniki

 

Klasyczna teoria testu (KTT) ma szerokie zastosowanie w rozwoju, opisie i niekiedy wyborze miary efektu w próbach klinicznych. To znaczy, jakość wyników, czy podawana przez klinicystów czy reprezentujące pacjentów raporty, jest często opisywana wyrażeniami „trafności” i „rzetelności”, dwoma cechami pochodzącymi z, zależnie od wewnętrznych założeń, klasycznej teorii testu.

Są bardzo rożne typy „trafności”, i podczas gdy są różne metody na obliczanie rzetelności, jest ona zdefiniowana przez klasyczną teorię testu, jako zgodność zaobserwowanego wyniku z wynikiem prawdziwym. Fundamentalną cechą klasycznej teorii testu jest sformułowanie, że każdy zaobserwowany wynik (X) jest funkcją prawdziwego wyniku jednostki (T) i losowego błędu pomiaru (e):

X=T+e

 

KTT skupia się na całkowitym wyniku testu

– teoretyczne konstrukty klasycznego testu operują na streszczeniu (sumie odpowiedzi, średniej odpowiedzi albo innym ujęciu ilościowym na ‘całkowitym poziomie’) pozycji, jednostkowe pozycje nie są brane pod uwagę. Wyjątkiem mogłaby być korelacja całkowitej-pozycji (albo przecięte na pół jej wersje). Nacisk na wynik całkowity teorii konstruktów oznacza, że kiedy miara efektu jest ustalona, opisana i wybrana na podstawie swojej rzetelności (jakkolwiek oszacowanej), sformułowanie osądu jest niemożliwe, i w zasadzie, powinno się rozważyć wymianę pozycji z osądu. Każdy wynik z 10 jest traktowany jako taki sam. Kolejną cechą opisów opartych na KTT jest to, że najlepiej się sprawdzają kiedy pojedynczy czynnik leży u źródła całkowitego wyniku. To może być rozwiązywane, w wieloczynnikowych oszacowaniach, za pomocą rzetelności „testlet” (np. dzieląc całe oszacowanie na jednowymiarowe kawałki, z których każdy ma pewne oszacowanie rzetelności). Kiedykolwiek KTT jest używana, założony jest błąd stały (dla wszystkich badanych), czyli błąd pomiaru wynikający z instrumentu badawczego musi być niezależny od prawdziwego wyniku.  To oznacza, że wynik, który jest mniej rzetelny dla jednostek z lepszym lub gorszym ogólnym wykonaniem zadania w teście nie spełnia założeń wymaganych dla interpretacji formuł pochodzących z KTT.

KTT oferuje kilka sposobów by oszacować rzetelność i założenia dla KTT mogą często być spełnione – ale wszystkie oszacowania tworzą założenia, które nie mogą być sprawdzone wewnątrz struktury KTT. Jeżeli założenia KTT nie są spełnione, wtedy rzetelność wciąż może być oszacowana, ale jej wynik nie będzie znaczący. Formuły same w sobie zadziałają; tylko że interpretacja tych wartości wyprowadzi na manowce.

IRT jest probabilistycznym (statystycznym, logistycznym) modelem tego jak badani odpowiedzieli na wszystkie dane im pozycje.

Item response theory (IRT) może być skontrastowana z klasyczną teorią testu na kilka sposobów; często IRT określa się jako „nowoczesną” teorię testu, co kontrastuje z „klasyczną” teorią testu. IRT NIE jest psychometrią. Rozmach psychometrii (i ograniczenia KTT) prowadzą do rozwoju IRT. KTT nie jest probabilistycznym modelem odpowiedzi. Zarówno klasyczne jak i nowoczesne podejścia teoretyczne do testowania rozwoju są pomocne w zrozumieniu i prawdopodobnie „mierzeniu”, psychologicznych zjawisk i konstruktów (i.e. oba są podciągnięte pod „psychometrię”). IRT ma potencjał do rozwoju i opisywania wyników prób klinicznych ponieważ zapewnia statystyczny model tego jak jak/dlaczego jednostki odpowiadają natrafiając na daną pozycję – i niezależnie, również o pozycjach samych w sobie. Opisy pochodzące z KTT dotyczą tylko całkowitych testów i są właściwe tylko dla próbki z której pochodzą, podczas gdy opisy testów pochodzące z IRT, ich składowe pozycje i jednostki są ogólne dla całej populacji pozycji albo jednostek. To jest kolejna cecha nowoczesnych metod, która jest bardzo atrakcyjna dla klinicystów. Co więcej, w IRT, rzetelność miary efektu ma inne znaczenie niż dla KTT: wtedy i tylko wtedy jeżeli model IRT pasuje, pozycje zawsze mierzą tę samą rzecz w taki sam sposób – dokładnie jak centymetry na linijce. Ta własność niezmienności jest kluczową cechą IRT.

W IRT pozycje same w sobie są scharakteryzowane; charakterystyki testu albo wyniku pochodzą po prostu z jego pozycji. W przeciwieństwie do KTT, jeżeli model pasuje, wtedy parametry pozycji (i charakterystyka testu z nich pochodząca) są niezmienne przy każdej populacji, i sprawdza się to również odwrotnie. Również inaczej niż w KTT, jeśli model IRT pasuje, wtedy charakterystyki pozycji mogą zależeć od twoich umiejętności (i.e. łatwiejsze/trudniejsze pozycje mogą mieć mniejszą/większą różnorodność).

Wewnątrz IRT, inaczej niż KTT, pozycje mogą być ukierunkowane, albo ulepszone z poszanowaniem ilości informacji jakich dostarczają o poziomie konstruktu naszego zainteresowania. To ma znaczące konsekwencje dla funkcjonalności i generalizacji rezultatów prób klinicznych, gdy używa się rezultatów pochodzących z IRT; i skomputeryzowanego testowania adaptacyjnego (CAT) uzyskującego odpowiedzi tylko z tych pozycji skupiających się coraz bardziej na danym poziomie konstruktu (lub umiejętności) jednostki. CAT ma potencjał by precyzyjnie oszacować to co rezultat stara się oszacować podczas minimalizacji liczby odpowiedzi wymaganych przez każdego uczestnika badania. Z IRT, testy mogą być dostosowane, albo ‘globalne’ testy mogą być rozwijane z precyzją w zakresie docelowym bazowego konstruktu, który podkreśla włączone kryteria albo dla którego etykietowanie FDA jest pożądane.

IRT jest potężne i oferuje możliwości w stylu klinicznych wyników, których KTT nie zapewnia.

Jednak modelowanie IRT jest złożone. System informacji o miarach wyników raportowanych pacjentów (The Patient Reported Outcome Measurement Information System – PROMIS) jest przykładem klinicznej próby wyników, które zostały opisane z użyciem IRT. Wszystkie pozycje (z obszaru zawartości) są połączone razem do oceny. Eksperci treści rozpoznają „najlepszą” reprezentację ich obszaru – wspierając test twarzy i trafność zawartości. Modele IRT są dopasowywane przez eksperckie zespoły modelujące IRT, które wykorzystują istniejące dane, tak aby wystarczająco dużej wielkości próbki zostały użyte przy oszacowywaniu parametrów pozycji. Pozycje, które nie pasują do zawartości, albo statystycznie, modelu są wyrzucane. Celem PROMIS jest „stworzenie trafnego, rzetelnego i uogólniającego działania dla klinicznych wyników zainteresowanych pacjentów.” Nieocenione w PROMIS – i wielu innych – protokoły są kierunkiem przyczynowości, jak pokazano na rysunku 1. Używając konstruktu „jakość życia” (QOL), rys. 1 pokazuje, że przyczynowość płynie z pozycji (qol1, qol2, qol3) do konstruktu (QOL). To jest, w tym przykładzie QOL jest konstruktem, który powstaje z odpowiedzi, których jednostki udzieliły w spisie pozycji QOL (3 są pokazane na rys. 1 dla ułatwienia). Poziom QOL nie powoduje różnic w tych odpowiedziach, różnorodność odpowiedzi powoduje różnice w konstrukcie QOL. Ten typ konstruktu jest nazywany „emergentnym” i jest powszechny. Problemem dla PROMIS (i podobnych aplikacji dla modeli IRT) jest fakt, że modele IRT wymagają przyczynowego czynnika będącego podstawą zaobserwowanych odpowiedzi, ponieważ warunkowanie przyczyny musi owocować warunkową niezależnością pozycji. Ta warunkowa niezależność (i.e. kiedy bazowa przyczyna jest utrzymywana na stałym poziomie, wcześniej skorelowane zmienne stają się statystycznie niezależne) jest krytycznym założeniem IRT. QOL i PROMIS są tylko przykładami tego kiedy przyczynowa kierunkowość jest utrudnieniem w możliwości interpretacji.

Jeśli ktoś odkryje, że model IRT pasuje do pozycji (qol1-3 na rys. 1), wtedy warunkowa niezależność w tych zaobserwowanych pozycjach musi pochodzić z przyczynowego czynnika; jest to zaprezentowane na rys. 1 przez ukryty czynnik F; warunkowanie czynnika, który wyłania się z zaobserwowanych pozycji, indukuje zależność, nie niezależność. Dlatego jeśli warunkowa niezależność została uzyskana, co jest niezbędne by model IRT pasował, i jeśli konstrukt (QOL na rys. 1) nie jest przyczynowy, wtedy musi być inny – przyczynowy – czynnik w systemie (F na rys. 1). Implikacja jest taka, że czynnik zainteresowania (np. QOL) nie jest konstruktem mierzonym na modelu IRT tak jak to jest pokazane na rys. 1 <właściwie, jest nim F>. Ten problem istnieje – potwierdzony bądź nie – dla każdego emergentnego konstruktu jakiego jak QOL pokazany na rys. 1. Wiele badań czynnika struktury zakłada model przyczynowy, wszystkie analizy IRT to zakładają. Rys. 1 pokazuje, że jeśli konstrukt nie jest przyczynowy, wtedy tym co mierzy model IRT nie tylko nie jest konstruktem zainteresowań, ale jeszcze wprowadza badacza w błąd, tak że myśli on, że model IRT opisuje konstrukt zainteresowań. Wysiłki takie jakie PROMIS, jeżeli omyłkowo są skierowane na konstrukty takie jak F zamiast QOL, marnują czas i cenne zasoby i dają fałszywy obraz własności, rzetelności i uogólnienia dla swoich wyników.

KTT i IRT różnią się w wielu aspektach.

Kluczowym podobieństwem jest to, że oba są modelami wykonania zadania; jeżeli założenia modelu nie są spełnione, konkluzje i interpretacje nie będą godne poparcia i badacz niekoniecznie będzie w stanie sprawdzić założeń. W przypadku IRT, jednakże, istnieją testy statystyczne pomagające ustalić czy konstrukt jest przyczynowy czy emergentny. Zarówno testowany z teoretycznej jak i statystycznej perspektywy, w modelowaniu IRT starannie powinno się rozważyć czy konstrukt jest przyczynowy czy emergentny.