analiza statystyczna ryzyka w bankowości

Zastosowanie czynnikowej analizy konfirmacyjnej na przykładzie problematycznych zachowań finansowych

Analiza statystyczna w kontekście potwierdzania kształtu struktury czynnikowej skal pomiarowych – zastosowanie metody konfirmacyjnej analizy czynnikowej na przykładzie wymiarów problematycznych zachowań finansowych.

Ze względu na doskonałe właściwości weryfikacyjne oraz rosnącą popularność konfirmacyjnej analizy czynnikowej, przedstawiamy wpis dotyczący procedury postępowania analitycznego w toku estymacji struktury czynnikowej skali problematycznych zachowań finansowych.

Opis kroków podjętych w celu wykrycia i potwierdzenia wymiarowości badanych konstruktów przedstawia poniższy link odsyłający do PDF z raportem.

Zastosowanie czynnikowej analizy konfirmacyjnej na przykładzie problematycznych zachowań finansowych <- klik

analiza statystyczna metodolog

Wykonanie analizy czynnikowej w praktyce.

meto

 

Wykonanie analizy czynnikowej w praktyce.

Wstęp.

Analiza czynnikowa jest metodą statystyczną polegającą na redukcji danych. Jej celem obliczeniowym jest wyszukanie powiązanych ze sobą zmiennych mogących mieć jakiś wspólny mianownik (wektor) np. pozycje kwestionariusza mierzące pewne spójne i reprezentatywne uniwersum zachowań np. ekstrawersję. Jest to dosyć prosta metoda statystyczna dająca bardzo zadowalające wyniki. Metodę tę często stosuje się w medycynie, psychologii, biostatystyce i psychometrii. Jej ekwiwalentem jest nowsza metoda o nazwie SVD (Singular Vector Decomposition). Obie metody zwracają podobne wyniki, lecz u podstaw leży inna metoda obliczeniowa i geneza powstania.

Aby przeprowadzić analizę czynnikową, nasze dane muszą spełniać kilka warunków:

  1. wszystkie zmienne muszą być mierzone na tej samej skali (chodzi tu o pozcyje testu)
  2. jeśli zmienne nie są wyrażone w tej samej jednostce pomiaru należy ów pomiary wystandaryzować
  3. odpowiedzi na pytania muszą charakteryzować się duża zmiennością (jeśli badani podobnie odpowiadali na dane pytanie w ankiecie to nie ma co takiego pytania włączać do analizy)
  4. badanych obserwacji powinno być tyle samo ile pozycji testowych, a z godnie z regułą kciuka 15 razy więcej
  5. nie powinno być sytuacji w której braki danych przekraczają 5%.

Zanim przeprowadzimy analize czynnikowa oprócz prostych statystyk opisowych musimy zrobić także bardziej skomplikowaną analizę, polegająca na diagnostyce dotyczacej tego czy nasze dane nadają się do przeprowadzenia analizy czynnikowej. Najlepiej jest uruchomić analize czynnikową.

Analiza miary K-M-O. Kryterium Kaisera/ Mayera / Olkina.

W analizie czynnikowej musimy podjąć na początku pewne decyzje związane z podstawowymi testami. Pierwszym kryterium jest ocena wyniku testu KMO. Miara KMO przyjmuje wartości od 0 do 1. Im wartość bliższa 1 tym bardziej wskazane jest przeporwadzenie analizy czynnikowej. Jeśli miara KMO jest niższa niż 0,7 to może być to spowodowane zbyt małą ilością badanych w stosunku do liczby pytań, złą konstrukcją pozycji testowych lub badana próba była zbyt jednorodna. Jeśli ocena wskaźnika KMO pozwoliła na akceptacje analizy to przeprowadzamy jeszcze raz analizę czynnikową.

Jak wyodrębniać czynniki?

W tym momencie musimy podjąć jakąś decyzję dotyczącą kryterium wyodrębniania czynników. Mamy do dyspozycji dwa kryteria.

Pierwszym jest kryterium Kaisera, które sugeruje wyodrebnienie tylu czynników ile sugerują wartości własne większe od 1 przy danym rozwiązaniu czynnikowym.

Drugim kryterium jest kształt wykresu osypiska (opartym o wartości własne). W kolejnym kroku podejmujemy decyzję o metodzie rotacji czynników. Decyzję o ilości czynników podejmujemy w oparciu  o wzrokową ocenę krzywizny linii na wykresie osypiska.

Rotacja.

W tym kroku podejmujemy decyzję o metodzie rotacji czynników. Jeśli test, który konstruujemy ma mieć więcej niż jeden wymiar, powinniśmy przeprowadzić jakąś z metod rotacji czynników, która spowoduje maksymalizację dostosować poszczególnym pozycji testowych do osi wyodrębnionych wymiarów. Po takiej rotacji macierz korelacji pytań/ pozycji testowych jest lepiej dopasowana a co za tym idzie, jest łatwiej interpretowana. Najczęściej wykonywane metody rotacji to metoda:

– Varimax

(metoda ortogonalna tak jak metoda Equamax i Quartimax) stosuje się ją do czynników potencjalnie będących od siebie niezależnych np. ekstrawersja i inteligencja.

– Promax

(metoda nieortogonalna, czyli ukośna. Metodą ukośną jest jeszcze metoda OBLIMIN z możliwością ustawienia stopnia korelacji między zmiennymi) Tą metodę stosuje się w przypadku silniego skorelowania wyodrebnianych wymiarów np. Inteligencja słowna i inteligencja matematyczna.

Interpretacja wyników procedury analizy czynnikowej.

Jest to jeden z trudniejszych etapów przeprowadzania analizy czynnikowej. Wpierw trzeba podjąć decyzję o ilości wariancji wyjaśnianej przez test. Jesli nie jest ona zadowalająca to trzeba się odnieść krytycznie do podjętych kroków wraz z rozpatrzeniem poprawności wykonania badania. Ponad to! Trzeba podjąć decyzję o pozycjach testowych wschodzących w skład danego czynnika i postarać się go nazwać. W większości wypadków pomaga w tym teoria leżąca u podstaw badanego narzędzia, lecz w przypadkach analiz eksploracyjnych takiego komfortu nie ma. Etykieta skomponowanego wymiaru powinna być uogólnieniem pozcyji wchodzących w skład skali.

Jeśli analiza czynnikowa dotyczy budowy kwestionariusza lub jego statystycznego przygotowania, zaleca się skonstruowanie klucza odpowiedzi. Jeśli analiza czynnikowa polega na redukcji danych mających zastosowanie w dalszych procedurach statystycznych zaleca się zapisanie tych wyników w jakimiś z języków programowania np. R lub Python.

Wyciskanie sensu z Alfy Cronbacha – analiza rzetelności.

meto

 

Wyciskanie sensu z Alfy Cronbacha 

Edukatorzy medyczni próbują stworzyć rzetelne i wiążące testy i kwestionariusze by zwiększyć trafność swoich szacunków i ocen. Trafność i rzetelność są dwoma fundamentalnymi elementami w ocenie narzędzi pomiaru. Narzędzia mogą być konwencjonalną wiedzą, umiejętnością lub stosunkiem testów, symulacji klinicznych albo ankiet kwestionariuszowych. Narzędzia mogą mierzyć pojęcia, zdolności psychomotoryczne albo wartości afektywne. Trafność rozumie się jako stopień w jakim narzędzie pomiaru mierzy to co miało zmierzyć. Rzetelność natomiast traktuje się jako zdolność narzędzia do wykonywania spójnych pomiarów. Powinno się zaznaczyć, że rzetelność narzędzia jest silnie powiązana z jego trafnością. Narzędzie nie może być trafne jeśli nie jest rzetelne. Jednakże, rzetelność narzędzia nie zależy od jego trafności. Jest możliwe by obiektywnie zmierzyć rzetelność narzędzia i w tym tekście wytłumaczymy znaczenie Alfy Cronbacha , najszerzej używanej obiektywnej miary rzetelności.

Liczenie alfy stało się powszechną praktyką w medycznej nauce badawczej kiedy w użyciu są złożone miary pojęcia albo konstruktu.

Dzieje się tak dlatego, że łatwiej jest użyć porównania z innymi szacunkami (np. retest rzetelności szacunków) ponieważ wymaga to zastosowania tylko jednego testu. Jednak pomimo powszechnego używania alfy w literaturze, jej znaczenie, właściwy sposób użycia i interpretacje nie są łatwo zrozumiałe. Dlatego uważamy, że ważnym jest aby wytłumaczyć zasadnicze założenia alfy aby promować efektywne jej używanie. Trzeba podkreślić, że celem tego tekstu jest skupienie się na Alfie Cronbacha jako wskaźniku rzetelności. Alternatywne metody mierzenia rzetelności opierające się na metodach psychometrycznych, takie jak teoria czynnika G albo teoria reagowania na pozycje testowe mogą zostać użyte by monitorować i poprawiać jakość badań OSCE, ale o nich nie będzie tutaj mowy.

Co to jest alfa Cronbacha?

 

Alfa została rozwinięta przez Lee Cronbacha w 1951 by zapewnić miarę wewnętrznej spójności dla testu albo skali; jest to wyrażone liczbą między 0 i 1. Wewnętrzna spójność opisuje stopień w jakim wszystkie pozycje w teście mierzą to samo pojęcie albo konstrukt i stąd jest to połączone ze wzajemnym powiązaniem ze sobą pozycji wewnątrz testu. Wewnętrzna spójność powinna być ustalona, by zapewnić trafność, zanim test zostanie użyty do badań albo celi badawczych. Dodatkowo, rzetelność szacuje pokazaną ilość błędów pomiarowych w teście. Mówiąc prosto, ta interpretacja rzetelności jest korelacją testu samego ze sobą. Podniesienie do kwadratu tej korelacji i odjęcie od 1.00 sprawi, że powstanie wskaźnik błędów pomiaru. Na przykład, jeżeli test ma rzetelność na poziome 0.80, występuje 0.36 zmienności błędu (błąd losowości) w wyniku (0.80×0.80=0.64; 1.00-0.64=0.36). Jeżeli oszacowana rzetelność rośnie, fragment wyniku testu przypadający na błąd będzie malał. Oczywiście rzetelność testu ujawnia efekt błędu pomiarowego dla obserwowalnego wyniku raczej dla grupy badanych niż pojedynczego badanego. By obliczyć efekt błędu pomiaru na obserwowalnym wyniku pojedynczego badanego, musi zostać wyliczone standardowy błąd pomiaru (SEM).

Jeżeli pozycje w teście są ze sobą skorelowane, wartość alfy wzrasta. Jednakże, wysoki współczynnik alfa nie zawsze oznacza wysoki stopień spójności wewnętrznej. To dlatego, że alfa jest również kształtowana przez długość testu. Jeżeli długość testu jest niewystarczająca, wartość alfy spada. Zatem, żeby zwiększyć alfę, więcej pozycji sprawdzających tę samą rzecz powinno zostać dodane do testu. Warto też pamiętać, że alfa jest właściwością dla wyniku testu ze specyficznej próbki badanych. Dlatego badacze nie powinni polegać na wydanych przez alfę oszacowaniach tylko mierzyć ją za każdym razem gdy test jest przeprowadzany.

Użycie alfy Cronbacha

 

Niewłaściwe zastosowanie alfy może doprowadzić do sytuacji, w której test albo skala zostaną błędnie odrzucone lub test zostanie skrytykowany za wygenerowanie niewiarygodnych wyników. By uniknąć takiej sytuacji, zrozumienie powiązanych ze sobą pojęć wewnętrznej spójności, jednorodności lub jednowymiarowości może być pomocne przy używaniu alfy. Wewnętrzna spójność dotyczy wzajemnie powiązanych próbek pozycji testu, podczas gdy jednorodność odnosi się do jednowymiarowości. Mówi się, że miara jest jednowymiarowa jeśli jej pozycje mierzą pojedynczą, ukrytą cechę albo konstrukt. Wewnętrzna spójność jest potrzebnym, ale nie jedynym warunkiem zmierzenia jednorodności czy jednowymiarowości w próbce pozycji testu. Zasadniczo, pojęcie rzetelności zakłada, że jednowymiarowość występuje w próbce pozycji testu, a jeśli to założenie nie jest spełnione, to powoduje duże niedoszacowanie rzetelności. Zostało solidnie udowodnione, że wielowymiarowy test nie koniecznie musi mieć mniejszą alfę niż jednowymiarowy test. Zatem bardziej rygorystyczna wartość alfy nie może być po prostu zinterpretowana jako wskaźnik wewnętrznej spójności.

Analiza czynnikowa może być użyta do określenia wymiarów testu. Inna technika, na której można polegać bywała również używana i zachęcamy czytelnika do zapoznania się z tekstem „Applied Dimensionality and Test Structure Assesment with START-M Mathematics Test” i porównania metod do oceniania wymiarowości i zasadniczej struktury testu.

Dlatego alfa nie tylko mierzy jednowymiarowość zestawu pozycji, ale może być użyta do potwierdzenia czy próbki pozycji są faktycznie jednowymiarowe. Z drugiej strony, jeśli test ma więcej niż jedno pojęcie lub konstrukt, może nie mieć sensu liczenie alfy dla testu jako całości jako że większa liczba pytań będzie niechybnie nadmuchiwała wartość alfy. Zasadniczo dlatego alfa powinna być liczona dla każdego pojęcia, a nie dla każdego testu albo skali. Implikacja podsumowującego badania zawierającego niejednorodne, oparte na case’ie pytania jest taka, że alfa powinna być liczona dla każdego z osobna.

Co ważniejsze, alfa jest osadzona w modelu równoważności co zakłada, że każda pozycja testu mierzy taką samą utajoną cechę na tej samej skali. Dlatego jeżeli wielokrotne czynniki/cechy są podstawą pozycji na skali, jak pokazała analiza czynnikowa, to założenie jest łamane i alfa zaniża rzetelność testu. Jeżeli liczba pozycji testu jest za mała to także złamie założenie o równoważności i zaniży rzetelność. Kiedy pozycje testu spełniają założenie o równoważności modelu, alfa lepiej szacuje rzetelność. W praktyce alfa Cronbacha jest dolną granicą szacunku rzetelności ponieważ niejednorodne pozycje testu mogą łamać założenia równoważności modelu. Jeżeli wyliczenie „wystandaryzowanej pozycji alfa” w SPSS jest wyższe niż „alfa Cronbacha”, dalsze badanie równoważności pomiaru może być niezbędne.

Numeryczne wartości alfy

 

Jak wcześniej wspomniano, liczba pozycji testu, wzajemnych powiązań testu i wymiarowości oddziaływania nad wartością alfy. Są różne doniesienia na temat dopuszczalnej wartości alfy, poczynając od 0.70 aż do 0.95. Niska wartość alfy może być powodowana małą liczbą pytań, słabą wzajemnością powiązań pomiędzy pozycjami albo niejednorodnymi konstruktami. Np. jeżeli niska alfa wychodzi na skutek słabej korelacji pomiędzy pozycjami wtedy niektóre powinny być powtórzone lub usunięte. Najłatwiejszym sposobem by je znaleźć jest przeliczenie korelacji dla każdej pozycji testu z całkowitym wynikiem testu; pozycje z niską korelacją (w okolicach zera) są usuwane. Jeśli alfa jest zbyt wysoka, może to sugerować, że niektóre pozycje są zbędne jako że testują to samo pytanie ale nieco inaczej wyglądają. Rekomendowana jest alfa o maksymalnej wartości 0.90.

Streszczenie

 

Wysokiej jakości testy są potrzebne aby ocenić rzetelność danych zawartych w badaniach naukowych. Na alfę wpływa długość i wymiarowość testu.  Alfa jako wskaźnik rzetelności powinna spełnić założenia o istotnej równoważności. Niska alfa pojawia się gdy te założenia nie są spełnione. Alfa nie mierzy po prostu jednorodności i jednowymiarowości testu, jako że na rzetelność testu działa także jego długość. Dłuższy test zwiększa rzetelność niezależnie od tego czy test jest jednorodny czy nie. Wysoka wartość alfy (>90) może sugerować pewien nadmiar i pokazuje, że test powinno się skrócić.

Wnioski

 

Alfa jest ważnym pojęciem w ocenie diagnozy i kwestionariuszy. Jest ważne by oceniający i badacze oszacowali jej stan by dodać trafności i precyzji w interpretacji danych. Tym niemniej jednak alfa często stosowana jest bezrefleksyjnie i bez odpowiedniego zrozumienia i interpretacji. W tym poradniku spróbowaliśmy wyjaśnić zasadnicze założenia wyliczania alfy, czynniki wpływające na jej wielkość i sposoby na jakie można interpretować jej wartość. Mamy nadzieję, że przyszli badacze będą bardziej krytyczni analizując wartości alfy w swoich badaniach.

 

Bibliografia:

Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16(3), 297–334. https://doi.org/10.1007/BF02310555

Kock, N. (2020). WarpPLS User Manual: Version 7.0 (7th ed.). ScriptWarp Systems.

 

Analiza statystyczna w psychometrii

Psychometria

meto

 

W sprawach psychometrii i teorii testów preferujemy kontakt telefoniczny.

Każda dziedzina nauki dała ludzkości coś wielkiego. Dawała i wciąż daje, choć aktualnie przyjmuje to trochę inny charakter, a mianowicie główne dziedziny rozpraszają się w coraz to nowsze i węższe specjalizacje. Te wielkie rzeczy łączyło to, że dbały o największe dobro- poprawiając bezpieczeństwo albo jakość życia. Podarowane zostało ludziom również wiele praktycznych wynalazków, które zaczęły być przez nich wykorzystywane na wielką skalę. Przykłady można mnożyć, są nimi między innymi:

– biologia – DNA (Watson i Cric 1853)

– medycyna – Antybiotyki i Szczepionki + drastyczne wydłużenie życia (Alexander Flemming 1928)

– inżynieria – Samolot (Bracia Wright 1903)

– fizyka – Energia Atomowa

– chemia – Nawozy Sztuczne (Carl Bosh i Fritz Haber 1927)

– biotechnologia – Inżynieria genetyczna i zapłodnienie in vitro

– socjologia – metody zwiększające zatrudnienie socjologów na rynku pracy

– projektowanie – Ferrari, Lamborgini, Audi

– marketing – Iphone

Ważne miejsce w tym rankingu zajmuje również psychologia – Testy psychologiczne i przewidywanie zachowania ludzi, jest to największe dobro stworzone przez psychologów.

Wprowadzenie.

Testy psychologiczne należą do najczęściej stosowanych przez psychologów narzędzi pomiarowych. Budzą też – także wśród samych psychologów – skrajne opinie. Złą sławą cieszą się, przede wszystkim, testy inteligencji. Ich konstruktorzy i użytkownicy są krytykowani ( głównie przez osoby nie do końca  obeznane z metodą psychometryczną ). Tak jak wszystko co nas otacza, tak i testy psychologiczne mają zarówno swoich zagorzałych zwolenników jak i przeciwników. Uważa się dziś, że po latach rozwoju technologii testów psychologicznych nie ma podstaw do odrzucenia tych specyficznych narzędzi pomiarowych. Trzeba natomiast eliminować z obiegu złe testy, czy wytwory działalności pseudopscyhometrów, którzy bez opamiętania produkują różne „potworki” lub „hybrydy”, udające prawdziwe testy psychologiczne. Często biorąc za nie duże pieniądze. Interpretacji testów, w sytuacji diagnostycznej, powinien dokonywać psycholog. Wykwalifikowany psycholog interpretuje wynik testowy, który jest wkomponowany w określoną teorię psychologiczną, która legła u podstaw konstrukcji testu oraz, która zakreśla ramy interpretacyjne wyniku. Niemniej jednak w skali przemysłowej do sytuacji diagnostycznej wcale nie musi dochodzić. Naszym celem jest niekiedy ilościowa klasyfikacja osób.

Po co wykonuje sie test ?

Testy są instrumentami służącymi do zbierania informacji, o człowieku, niezbędnych do pomiaru psychologicznego.

Diagnoza jest procesem zbierania danych, niezbędnych do podjęcia działań, których celem jest zmiana aktualnego działania ludzi (terapia, porada, interwencja, decyzja administracyjna)

Co test mierzy ?

Testy są metodami zbierającymi dane o różnicach w zachowaniu ludzi oraz stałość czasową i międzysytuacjyną zachowań pojedynczych osób.

Czym jest test ?

Zbiór zadań lub pytań – w standardowych warunkach (identycznych dla każdego testowanego) wywołujących określone rodzaje zachowań, które można zebrać w postaci wskaźnika liczbowego. Pomiar ten musi charakteryzować się pożądanymi wartościami psychometrycznymi, takimi jak wysoka rzetelność i wysoka trafność.

Elementarne składniki testu:

– pozycje testowe

– procedura przeprowadzania testu

– skala – pozwalająca ocenić wywołane reakcje, które są pochodnymi cechy, na skali ilościowej lub jakościowej

– reguły dochodzenia do wyniku testu oraz ocena wiarygodności tego wyniku – nasilenie danej cechy u danego człowieka oraz dobroć pomiaru testem.

Cechy testu

Rzetelność – na potrzeby testu opracowano materiały testowe i procedury badania, które maksymalizują dokładność pomiaru cechy badanej przez test.

Trafność – na potrzeby testu opracowano materiały testowe i procedury, które maksymalizują stopień w jakim test mierzy docelową cechę.

Zalety i wady testów:

Testy „reprezentują najbardziej wartościową i sprawiedliwą technologię, umożliwiającą podejmowanie wielu ważnych decyzji o ludziach”, ale jednocześnie „testowanie psychologiczne jest bardzo kontrowersyjne” (Murphy i Davidshofer, 1989, s. 2).

Testy– potrzeby rynku, oczekiwania klientów

Wg Sternberga (1992) i Morelanda (1995) oraz Standardów APA (1985), współczesny klient – przekonany o społecznej zasadności testowania – chciałby, aby testy psychologiczne gwarantowały:

– przewidywanie

– małą zmienność wyników,

– normalizację

– standaryzację

– prostotę stosowalności

– łatwość dochodzenia do wyniku

– obiektywną punktację,

  spektrum stosowalności,

– ochronę wyników,

– wyniki testów psychologicznych muszą się dawać obronić, gdyby decyzje podjęte na ich podstawie trafiły do sądów.

Pojęcie cechy

Cecha – zmienna osobowa, która wykazuje międzyosobniczą zmienność i wewnątrzosobniczą stałość (czasową i sytuacyjną).

Założenie o normalności rozkładu cech.

Zakłada się, że cechy psychologiczne mają rozkład normalny w populacji (tak jak wzrost, długość ręki, tętno, rozmiar stopy, niedopieszczane wyniki matur).  Na tej podstawie wyciąga się wnioski, o tym, że krzywa normalna jest modelowym rozkładem wyników testu.

Żeby skonstruować psychometryczną linijkę trzeba użyć do tego pozycji testowych, które są wyraźnie nacechowane i w jednakowym stopniu powiązane z mierzoną cechą.

Dąży się do tego, aby pozycje diagnostyczne jak najbardziej różnicowały badanych pod względem reagowania , opisu zachowania lub przekonań.

Do budowy miary wykorzystuje się zmienność międzyosobniczą i stałość wewnątrz-osobniczą.

Każde oprzyrządowanie pomiarowe ma swój błąd. W przypadku testowania psychologicznego odpowiedź na daną pozycję może być odgadnięta lub przypadkowa. Dlatego wykorzystuje się do pomiaru od kilku do kilkunastu, zazwyczaj, pozycji testowych.

Współwystępowanie zachowań.

Cecha jest ukrytą i stałą własnością funkcjonowania człowieka, której ekspresją obserwowaną jest zachowanie. Na podstawie znajomości  cech można przewidywać potencjalne zachowania, które wychodzą poza pole zachowań mierzonych przez test.

Cechą definiuje się właściwości determinujące współwystępowanie pewnej puli zachowań.  np. ekstrawersja łączy w sobie towarzyskość, emocjonalność, ilość znajomych, pobudzenie, reagowanie na nagrodę/karę, uczenie się, spędzanie wolnego czasu, zadowolenie z życia itd.

Pojedyncze zachowanie bywa ekspresją wielu cech, ale kombinacja wielu zachowań jednoznacznie określa poziom nasilenia danej cechy.

Właściwości testu zależą bezpośrednio od wyników poszczególnych pozycji (oraz ich wzajemnej korelacji)

Rzetelność testu.

błąd pomiaru = odchylenie standardowe √(1 – dokładność pomiarowa skali)

Potocznie rzetelność znaczy niezawodność/dokładność pomiaru. W psychometrii rzetelność jest to powtarzalność wyników otrzymywanych przy pomiarze tym samym testem, w tych samych warunkach badania. Ponieważ wielokrotne (nieskończone) badanie tym samym testem jednej osoby nie jest możliwe, to błąd pomiaru jest szacowany na podstawie rozkładu błędów pomiaru licznych (ale różnych) osób badanych. W ramach Klasycznej Teorii Testów standardowy błąd pomiaru definiuje przedział, w jakim znajduje się prawdziwy wynik osoby badanej. Błąd ten jest identyczny dla wszystkich osób badanych i dla wszystkich wyników otrzymanych. Jest on silnie związany z rzetelnością (tak jak dokładność z jaką laser lub metoda CNC wycina formę w metalach, zawsze jakaś nieidealność będzie istnieć). W naszej koncepcji jest to bardzo ważne. Wartość rzetelności przyjmuje wartości od 0 do 1. Im bliżej 1 tym błąd pomiaru jest mniejszy. Oznacza to, że wynik zależy bardziej od właściwości pozycji testowych niż od innych czynników. Gdyby rzetelność wynosiła 1 to wynik otrzymany w teście był by wynikiem prawdziwym. Jest to jednak sytuacja modelowa, rzetelność zwykle jest mniejsza od 1 i dlatego w diagnozie, poziom cechy szacuje się w określonym przedziale ufności, z określonym prawdopodobieństwem. Jednak tylko przy diagnozie indywidualnej. W swej logice obliczeniowej miara ta określa, na ile pozycje wchodzące w skład danego wymiaru osobowości są do siebie podobne i czy badają to samo zjawisko. Krótko mówiąc, określa to jaka jest zgodność odpowiedzi badanych na pozycje testowe. Jeśli zaznaczają jedną odpowiedz, to zaznaczają też inne podobne do tych odpowiedzi.

Trafność pomiaru testowego.

Zbadanie trafności odpowiada na pytania:

– co test mierzy i jak dobrze to robi ?

– czy dana skala odpowiada celom jego użytkownika ?

– jakie jest pole stosowania testu ?

Szacowanie trafności jest nazywane walidacją, która jest niekończącą się historią. Im więcej badań tym więcej informacji na temat działania skali i jej potencjału aplikowalności.

Konstruowanie – etapy opracowywanie testu.

– konceptualizacja tego, co ma być mierzone

– operacjonalizacja (jest to procedura wiązania pojęć teoretycznych z obserowowanymi wskaźnikami). Określenie puli pozycji testowych, które będą wskaźnikami mierzonej cechy

– określenie formatu pozycji i gradacji

– zgromadzenie dużej puli pozycji testowych.

– badanie

– analiza statystyczna

– zbudowanie wyjściowej wersji testu.

– manual (podręcznik obsługi z odpowiednimi normami)


thomas-bayes