Wyciskanie sensu z Alfy Cronbacha – analiza rzetelności.

meto

 

Wyciskanie sensu z Alfy Cronbacha 

Edukatorzy medyczni próbują stworzyć rzetelne i wiążące testy i kwestionariusze by zwiększyć trafność swoich szacunków i ocen. Trafność i rzetelność są dwoma fundamentalnymi elementami w ocenie narzędzi pomiaru. Narzędzia mogą być konwencjonalną wiedzą, umiejętnością lub stosunkiem testów, symulacji klinicznych albo ankiet kwestionariuszowych. Narzędzia mogą mierzyć pojęcia, zdolności psychomotoryczne albo wartości afektywne. Trafność rozumie się jako stopień w jakim narzędzie pomiaru mierzy to co miało zmierzyć. Rzetelność natomiast traktuje się jako zdolność narzędzia do wykonywania spójnych pomiarów. Powinno się zaznaczyć, że rzetelność narzędzia jest silnie powiązana z jego trafnością. Narzędzie nie może być trafne jeśli nie jest rzetelne. Jednakże, rzetelność narzędzia nie zależy od jego trafności. Jest możliwe by obiektywnie zmierzyć rzetelność narzędzia i w tym tekście wytłumaczymy znaczenie Alfy Cronbacha , najszerzej używanej obiektywnej miary rzetelności.

Liczenie alfy stało się powszechną praktyką w medycznej nauce badawczej kiedy w użyciu są złożone miary pojęcia albo konstruktu.

Dzieje się tak dlatego, że łatwiej jest użyć porównania z innymi szacunkami (np. retest rzetelności szacunków) ponieważ wymaga to zastosowania tylko jednego testu. Jednak pomimo powszechnego używania alfy w literaturze, jej znaczenie, właściwy sposób użycia i interpretacje nie są łatwo zrozumiałe. Dlatego uważamy, że ważnym jest aby wytłumaczyć zasadnicze założenia alfy aby promować efektywne jej używanie. Trzeba podkreślić, że celem tego tekstu jest skupienie się na Alfie Cronbacha jako wskaźniku rzetelności. Alternatywne metody mierzenia rzetelności opierające się na metodach psychometrycznych, takie jak teoria czynnika G albo teoria reagowania na pozycje testowe mogą zostać użyte by monitorować i poprawiać jakość badań OSCE, ale o nich nie będzie tutaj mowy.

Co to jest alfa Cronbacha?

 

Alfa została rozwinięta przez Lee Cronbacha w 1951 by zapewnić miarę wewnętrznej spójności dla testu albo skali; jest to wyrażone liczbą między 0 i 1. Wewnętrzna spójność opisuje stopień w jakim wszystkie pozycje w teście mierzą to samo pojęcie albo konstrukt i stąd jest to połączone ze wzajemnym powiązaniem ze sobą pozycji wewnątrz testu. Wewnętrzna spójność powinna być ustalona, by zapewnić trafność, zanim test zostanie użyty do badań albo celi badawczych. Dodatkowo, rzetelność szacuje pokazaną ilość błędów pomiarowych w teście. Mówiąc prosto, ta interpretacja rzetelności jest korelacją testu samego ze sobą. Podniesienie do kwadratu tej korelacji i odjęcie od 1.00 sprawi, że powstanie wskaźnik błędów pomiaru. Na przykład, jeżeli test ma rzetelność na poziome 0.80, występuje 0.36 zmienności błędu (błąd losowości) w wyniku (0.80×0.80=0.64; 1.00-0.64=0.36). Jeżeli oszacowana rzetelność rośnie, fragment wyniku testu przypadający na błąd będzie malał. Oczywiście rzetelność testu ujawnia efekt błędu pomiarowego dla obserwowalnego wyniku raczej dla grupy badanych niż pojedynczego badanego. By obliczyć efekt błędu pomiaru na obserwowalnym wyniku pojedynczego badanego, musi zostać wyliczone standardowy błąd pomiaru (SEM).

Jeżeli pozycje w teście są ze sobą skorelowane, wartość alfy wzrasta. Jednakże, wysoki współczynnik alfa nie zawsze oznacza wysoki stopień spójności wewnętrznej. To dlatego, że alfa jest również kształtowana przez długość testu. Jeżeli długość testu jest niewystarczająca, wartość alfy spada. Zatem, żeby zwiększyć alfę, więcej pozycji sprawdzających tę samą rzecz powinno zostać dodane do testu. Warto też pamiętać, że alfa jest właściwością dla wyniku testu ze specyficznej próbki badanych. Dlatego badacze nie powinni polegać na wydanych przez alfę oszacowaniach tylko mierzyć ją za każdym razem gdy test jest przeprowadzany.

Użycie alfy Cronbacha

 

Niewłaściwe zastosowanie alfy może doprowadzić do sytuacji, w której test albo skala zostaną błędnie odrzucone lub test zostanie skrytykowany za wygenerowanie niewiarygodnych wyników. By uniknąć takiej sytuacji, zrozumienie powiązanych ze sobą pojęć wewnętrznej spójności, jednorodności lub jednowymiarowości może być pomocne przy używaniu alfy. Wewnętrzna spójność dotyczy wzajemnie powiązanych próbek pozycji testu, podczas gdy jednorodność odnosi się do jednowymiarowości. Mówi się, że miara jest jednowymiarowa jeśli jej pozycje mierzą pojedynczą, ukrytą cechę albo konstrukt. Wewnętrzna spójność jest potrzebnym, ale nie jedynym warunkiem zmierzenia jednorodności czy jednowymiarowości w próbce pozycji testu. Zasadniczo, pojęcie rzetelności zakłada, że jednowymiarowość występuje w próbce pozycji testu, a jeśli to założenie nie jest spełnione, to powoduje duże niedoszacowanie rzetelności. Zostało solidnie udowodnione, że wielowymiarowy test nie koniecznie musi mieć mniejszą alfę niż jednowymiarowy test. Zatem bardziej rygorystyczna wartość alfy nie może być po prostu zinterpretowana jako wskaźnik wewnętrznej spójności.

Analiza czynnikowa może być użyta do określenia wymiarów testu. Inna technika, na której można polegać bywała również używana i zachęcamy czytelnika do zapoznania się z tekstem „Applied Dimensionality and Test Structure Assesment with START-M Mathematics Test” i porównania metod do oceniania wymiarowości i zasadniczej struktury testu.

Dlatego alfa nie tylko mierzy jednowymiarowość zestawu pozycji, ale może być użyta do potwierdzenia czy próbki pozycji są faktycznie jednowymiarowe. Z drugiej strony, jeśli test ma więcej niż jedno pojęcie lub konstrukt, może nie mieć sensu liczenie alfy dla testu jako całości jako że większa liczba pytań będzie niechybnie nadmuchiwała wartość alfy. Zasadniczo dlatego alfa powinna być liczona dla każdego pojęcia, a nie dla każdego testu albo skali. Implikacja podsumowującego badania zawierającego niejednorodne, oparte na case’ie pytania jest taka, że alfa powinna być liczona dla każdego z osobna.

Co ważniejsze, alfa jest osadzona w modelu równoważności co zakłada, że każda pozycja testu mierzy taką samą utajoną cechę na tej samej skali. Dlatego jeżeli wielokrotne czynniki/cechy są podstawą pozycji na skali, jak pokazała analiza czynnikowa, to założenie jest łamane i alfa zaniża rzetelność testu. Jeżeli liczba pozycji testu jest za mała to także złamie założenie o równoważności i zaniży rzetelność. Kiedy pozycje testu spełniają założenie o równoważności modelu, alfa lepiej szacuje rzetelność. W praktyce alfa Cronbacha jest dolną granicą szacunku rzetelności ponieważ niejednorodne pozycje testu mogą łamać założenia równoważności modelu. Jeżeli wyliczenie „wystandaryzowanej pozycji alfa” w SPSS jest wyższe niż „alfa Cronbacha”, dalsze badanie równoważności pomiaru może być niezbędne.

Numeryczne wartości alfy

 

Jak wcześniej wspomniano, liczba pozycji testu, wzajemnych powiązań testu i wymiarowości oddziaływania nad wartością alfy. Są różne doniesienia na temat dopuszczalnej wartości alfy, poczynając od 0.70 aż do 0.95. Niska wartość alfy może być powodowana małą liczbą pytań, słabą wzajemnością powiązań pomiędzy pozycjami albo niejednorodnymi konstruktami. Np. jeżeli niska alfa wychodzi na skutek słabej korelacji pomiędzy pozycjami wtedy niektóre powinny być powtórzone lub usunięte. Najłatwiejszym sposobem by je znaleźć jest przeliczenie korelacji dla każdej pozycji testu z całkowitym wynikiem testu; pozycje z niską korelacją (w okolicach zera) są usuwane. Jeśli alfa jest zbyt wysoka, może to sugerować, że niektóre pozycje są zbędne jako że testują to samo pytanie ale nieco inaczej wyglądają. Rekomendowana jest alfa o maksymalnej wartości 0.90.

Streszczenie

 

Wysokiej jakości testy są potrzebne aby ocenić rzetelność danych zawartych w badaniach naukowych. Na alfę wpływa długość i wymiarowość testu.  Alfa jako wskaźnik rzetelności powinna spełnić założenia o istotnej równoważności. Niska alfa pojawia się gdy te założenia nie są spełnione. Alfa nie mierzy po prostu jednorodności i jednowymiarowości testu, jako że na rzetelność testu działa także jego długość. Dłuższy test zwiększa rzetelność niezależnie od tego czy test jest jednorodny czy nie. Wysoka wartość alfy (>90) może sugerować pewien nadmiar i pokazuje, że test powinno się skrócić.

Wnioski

 

Alfa jest ważnym pojęciem w ocenie diagnozy i kwestionariuszy. Jest ważne by oceniający i badacze oszacowali jej stan by dodać trafności i precyzji w interpretacji danych. Tym niemniej jednak alfa często stosowana jest bezrefleksyjnie i bez odpowiedniego zrozumienia i interpretacji. W tym poradniku spróbowaliśmy wyjaśnić zasadnicze założenia wyliczania alfy, czynniki wpływające na jej wielkość i sposoby na jakie można interpretować jej wartość. Mamy nadzieję, że przyszli badacze będą bardziej krytyczni analizując wartości alfy w swoich badaniach.

 

Bibliografia:

Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16(3), 297–334. https://doi.org/10.1007/BF02310555

Kock, N. (2020). WarpPLS User Manual: Version 7.0 (7th ed.). ScriptWarp Systems.

 

Analiza statystyczna standardy APA

Współczynnik rzetelności – Alfa Cronbacha.

meto

 

 Alfa Cronbacha jest statystyką. Używa się jej zwykle do mierzenia wewnętrznej spójności albo rzetelności psychometrycznego narzędzia.

 

Innymi słowy, mierzy jak dobrze zestaw zmiennych albo pozycji mierzy pojedynczy, jednowymiarowy ukryty aspekt jednostki. Generalnie, niejedna wielkość zainteresowania medycznego, jak lęk albo poziom niepełnosprawności, są niemożliwe do jednoznacznego zmierzenia. W takich przypadkach, zadajemy szereg pytań i łączymy odpowiedzi w jedną, liczbową wartość.

Co to jest?

 

Na przykład, załóżmy, że chcemy się dowiedzieć jaki jest stopień niepełnosprawności pacjentów cierpiących na mielopatię szyjki macicy.

Najpierw przygotujemy tabelę z 10 pozycjami rejestrującymi poziom trudności napotykanych przy wykonywaniu codziennych czynności. Każda pozycja jest oceniana od 1 co znaczy „bezproblemowo” do 4 co oznacza „niewykonalne”. Zsumowany wynik z tych 10 pozycji da nam ostateczny rezultat.

Jednakże, kiedy pozycje są użyte by stworzyć skalę, muszą być wewnętrznie spójne. Każda z pozycji powinna mierzyć tę samą rzecz, więc powinny być one ze sobą skorelowane. Alfa Cronbacha generalnie wrasta gdy korelacje pomiędzy pozycjami wzrastają. Z tego powodu, współczynnik jest także nazywany spójnością wewnętrzną albo wewnętrzną spójnością rzetelności dla testu.

Zakres

 

Wartość alfa (α) może się znajdować pomiędzy minus nieskończonością a 1. Jednak, tylko dodatnia wartość (α) ma sens. Generalnie, współczynnik alfa ma zakres od 0 do 1 i może zostać wykorzystany do opisania rzetelności czynników wydobytych dychotomicznie (czyli pytań z dwoma możliwymi odpowiedziami) i/albo kwestionariuszy lub skali sformatowanych wielopunktowo (np. skala oceny 1=biedny, 5=wyśmienity).

Niektórzy znawcy nalegają by wynik rzetelności wynosił 0,7 albo więcej w czasie używania psychometrycznego narzędzia. Ta zasada powinna być stosowana ostrożnie gdy (α) ma być liczona z pozycji, które nie są skorelowane.

Zastrzeżenia

 

Pomimo, że Alfa Cronbacha jest dzisiaj szeroko stosowana, jest związanych z nią kilka problemów.

 

Pierwszym problemem jest to, że alfa jest zależna nie tylko od wielkości korelacji pomiędzy pozycjami, ale także od liczby pozycji na skali. Skala może sprawiać wrażenie „homogenicznej” poprzez zwykłe dublowanie liczby pozycji, nawet jeżeli średnie korelacji pozostaną niezmienne.

 

To prowadzi prosto do drugiego problemu. Jeżeli mamy dwie skale z których każda mierzy odrębny aspekt, i połączymy je by stworzyć jedną długą skalę, alfa prawdopodobnie będzie wysoka, chociaż połączona skala w oczywisty sposób dotyka dwóch różnych atrybutów.

 

Po trzecie, jeśli alfa jest zbyt wysoka, może to sugerować nadmierną ilość pozycji, to znaczy, pozycji zadających to samo pytanie w odrobinę inny sposób. 

 

Więcej informacji na:

Analiza rzetelności

Analiza statystyczna danych do pracy doktorskiej

Rzetelność Pomiaru

Psychometria 2

Model połówkowy – Analiza rzetelności

Analiza danych statystycznych opracowanie statystyczne badania ankiety danych historycznych

Wprowadzenie do analizy równań strukturalnych. Analiza ścieżek / SEM / SEPATH

Statystyczna analiza danych w psychologii

Usługi statystyczne pomoc statystyczna

Pomoc statystyczna dla doktorantów. Czy taka pomoc jest niezbędna?

Dane binarne w statystyce

Rzetelność pomiaru.

meto1

rzetelny

  1. «wypełniający należycie swe obowiązki»

  2. «taki, jaki powinien być, odpowiadający wymaganiom»

  3. «zgodny z prawdą, wiarygodny»”

Słownik języka polskiego PWN

Wszyscy cenimy ludzi rzetelnych. Wypełniających należycie swe obowiązki. Takich, jacy powinni być, odpowiadających wymaganiom. Mówiących rzeczy zgodne z prawda, wiarygodnych, według definicji „Słownika języka polskiego” PWN. Lecz jest pewna grupa ludzi, która rzetelności nie wymaga tylko od ludzi, ale przede wszystkim od zupełnie czegoś innego. Tak, mówimy o badaczach. Bo czego, jeżeli nie wiarygodnego obrazu rzeczywistości poszukują oni w swoich badaniach. Choć rzetelność w rozumieniu psychometrycznym nieco odbiega od tej, która została przedstawiona powyżej, to idea pozostaje ta sama. Chodzi o to by uzyskane przez nas wyniki jak najtrafniej oddawały rzeczywisty charakter badanego zjawiska. By nasze badanie wypełniało należycie swe obowiązki – udzielało odpowiedzi dokładnie na to zagadnienie, które chcemy zgłębić.

Budując kwestionariusz do pomiaru jakiegoś pojęcia umieszczamy w nim optymalną liczbę pozycji, czyli wskaźników naszego badania. Przez optymalna rozumiemy taką, która uwzględnia zarówno wyliczoną liczbę pozycji odpowiadającą wartości pożądanej przez nas rzetelności, jak i czynniki poboczne w obrębie naszego badania. Co to znaczy? Teoria teorią, wzory wzorami, ale musimy się liczyć z tym, że gdy wyliczymy sobie jakąś horrendalnie dużą liczbę pozycji potrzebną do uzyskania oczekiwanej rzetelności i umieścimy ją w formularzu, to możemy mieć problem, chociażby ze znalezieniem chętnych do wzięcia udziału w badaniu. Gdy już uda się nam określić optymalną liczbę pozycji, dopasowujemy do niej skalę. W zależności od charakteru przeprowadzanego badania, dobieramy ilość stopni skali. Gdy to wszystko jest już gotowe, pomiary dokonane, możemy przejść do analizy zebranych pomiarów, a co nas w dzisiejszym wpisie najbardziej interesuje – współczynnika rzetelności.

W modelu klasycznym każdy pomiar odzwierciedla do pewnego stopnia prawdziwy wynik dla badanego pojęcia, a do pewnego stopnia nieznany błąd losowy.

x=tau+error

X – odpowiedni faktyczny pomiar

tau – powszechnie używane do oznaczenia wyniku prawdziwego

error – składnik błędu losowego pomiaru

W takim rozumieniu, warunkiem rzetelnego pomiaru jest wyższy wynik prawdziwy (tau) od błędu (error). Stąd już niedaleka droga do współczynnika rzetelności. Rozumiemy go w kategoriach proporcji zmienności wyniku prawdziwego, która jest ujęta dla wszystkich osobników lub respondentów w stosunku do całkowitej obserwowanej zmienności i może być zapisana w następujący sposób:

A co będzie gdy utworzone przez nas pozycje mają różny poziom rzetelności? Jeśli składnik błędu w odpowiedziach jest rzeczywiście losowy, to możemy oczekiwać, że wartość oczekiwana lub średnia składnika błędu po pozycjach będzie równa zero. Im większa liczba pozycji, tym bardziej w skali sumarycznej odzwierciedlony zostanie wynik prawdziwy.

Najbardziej popularnym współczynnikiem, stosowanym do szacowania rzetelności skali sumarycznej jest alfa Cronbacha.

– wariancja k pojedynczych pozycji

– wariancja sumy wszystkich pozycji

Współczynnik ten przyjmuje wartości od 0 do 1. W przypadku gdy pozycje w ogóle nie dają wyniku prawdziwego, ale jedynie błąd, to wariancja sumy będzie równa sumie wariancji poszczególnych pozycji, a współczynnik alfa będzie wynosił zero. Natomiast wartość 1 otrzymamy wtedy, gdy wszystkie pozycje są idealnie rzetelne i mierzą tę samą rzecz.

Dla pozycji binarnych (prawda/fałsz) chcąc obliczyć alfę Cronbacha, korzystamy z tzw. wzoru 20 Kudera-Richardsona na rzetelność skal sumarycznych. Współczynnik rzetelności obliczany w ten sposób określa się  jako rzetelność wewnętrznie zgodną.

Alternatywna droga w obliczaniu rzetelności skali sumarycznej wymaga od nas podzielenia tej skali w losowy sposób i sprawdzenia korelacji występujących między połówkami. Doskonała korelacja (r=1,0) świadczy o doskonałej rzetelności. By to sprawdzić, do oszacowania wykorzystujemy współczynnik połówkowy Spearmana-Browna:

A jakie są konsekwencje rzetelności mniejszej niż doskonała? Jak możemy się domyślać, im większy udział błędu losowego w faktycznym pomiarze, tym mniejszy udział wyniku prawdziwego. Może to świadczyć o tym, że w rzeczywistości zbadaliśmy zagadnienie zupełnie inne niż to, które pragnęliśmy zgłębić. By się o tym przekonać możemy zbadać korelację z powiązanymi zewnętrznymi kryteriami. Gdy wszystko jest skorelowane, możemy mówić o trafności skali. Dochodzenie do trafności skali jest bardzo praco- i czasochłonne, bo wymaga rozważenia wielu zewnętrznych kryteriów, które teoretycznie powinny być powiązane z pojęciem z założenia mierzonym przez skalę.

Gdy otrzymaliśmy już rzetelność zarówno skali jak i zmiennej kryterium, i wiemy, ze są one skorelowane możemy oszacować rzeczywistą korelację wyników prawdziwych w obu miarach. Co to oznacza? Przy pomocy poniższego wzoru mamy możliwość skorygować korelację ze względu na tłumienie.

– estymator korelacji między wynikami prawdziwymi w obu miarach x i y

,  – rzetelność miar (skal) x i y

Autorem tekstu jest Martyna Kuligowska

Martyna Kuligowska Analiza statystyczna danych

Pomiary w badaniach psychologicznych.

meto

 

„Not everything that counts can be counted, and not everything that can be counted counts.”

Albert Einstein

Postaramy się dzisiaj opowiedzieć trochę co nieco o pomiarach badawczych.

Odnosząc się do powyższego cytatu to właśnie zmienne teoretyczne się liczą, lecz nie mogą być policzone. Natomiast wiele „zanieczyszczonych” zmiennych może być policzone, lecz mają one zerowe znaczenie, bądź nawet wprowadzają szum do badania. Ale zacznijmy od początku.

Do wyboru mamy szeroki wachlarz metod pomiarowych: miary obserwacyjne (gdy rejestrujemy zachowania osób badanych), miary samoopisowe, czyli ankiety i kwestionariusze, jak również miary wykonaniowe, a nawet dane archiwalne. Od tego czy prawidłowo dobierzemy narzędzia zależy dalsze powodzenie badania. Możemy to porównać do soczewek. Na przykład: gdy dalekowidz będzie chciał przeczytać książkę to dużo bardziej przydadzą mu się okulary z soczewkami na plusie, niż te na minusie. Tak samo jest w przypadku pomiaru. Odpowiednio dobrane narzędzia są podstawą do uchwycenia istoty badania, a od ich precyzji zależy to, czy uda się wykryć różnice.

Na początku musimy zaprojektować sposób pomiaru zmiennej teoretycznej, ustalić co będzie wskaźnikiem zmiennej (operacjonalizacja).

Istnieje szereg sposobów, na jakie można mierzyć zmienną teoretyczną, uzyskując wiele jej wskaźników. To wiąże się z tym, że uzyskane wyniki nie zawsze będą adekwatne do badania. Należy pamiętać, że wszystkie wskaźniki są w pewnym stopniu „zanieczyszczone” wpływem innych zmiennych i nie jesteśmy w stanie tego zanieczyszczenia w stu procentach wyeliminować. Dobrym wyjściem w tej sytuacji jest użycie miar złożonych, a nie posługiwanie się pojedynczym wskaźnikiem interesującej nas zmiennej.

Gdy za pomocą odpowiednio dobranych narzędzi dokonamy już pomiaru, zebrane wyniki należałoby jakoś zakodować.

Tutaj z pomocą przychodzą nam skale pomiarowe. W zależności od charakteru zmiennych, możemy je mierzyć na skalach jakościowych i ilościowych. Gdy dokonujemy pomiaru takiej zmiennej jak np. kolor włosów, używamy najniższej skali jakościowej – skali nominalnej. Przy jej pomocy nie porządkujemy danych według jakiejś hierarchii, lecz tylko je klasyfikujemy. Pozwala nam ona na odróżnienie jednego obiektu od drugiego. Kiedy mamy do czynienia ze zmiennymi, które tworzą jakąś hierarchię, możemy posłużyć się wyższą skalą jakościową – skalą  porządkową. Dzięki zastosowaniu jej, otrzymujemy informacje o porządku poszczególnych wartości. Istotą tej skali jest to, że nie dysponujemy żadnymi jednostkami miary, więc nie pozwala nam ona oszacować o ile wynik X różni się od wyniku Y, natomiast możemy oszacować ich relację większy/mniejszy.

Jeżeli odległość między poszczególnymi wartościami na skali jest taka sama, to jest to jednoznaczne z występowaniem jednostek, a co za tym idzie używamy skali ilościowych.

Przy ich pomocy możemy nie tylko ustalić porządek danych, ale również dystans między nimi. Kryterium odróżniającym skale w ramach skali ilościowych, jest występowanie zera bezwzględnego. I tak, na skali przedziałowej mogą pojawiać się wartości ujemne, ponieważ punkt odniesienia skali nie jest bezwzględny (temperatura w stopniach Celsjusza). Na skali ilorazowej, wartości ujemne nie występują ponieważ charakter mierzonych danych na to nie pozwala, istnieje zero bezwzględne (np. liczba dzieci, wiek). Ta skala umożliwia nam nie tylko ustalenie relacji, odległości między danymi ale też stosunek ile razy wynik X jest większy od wyniku Y. Przy dokonywaniu pomiarów należy mierzyć zmienne tak, by uzyskać jak najwyższą skalę, gdyż im wyższa skala tym większą mamy zapewniona dokładność, a więc tym większe szanse na uchwycenie subtelnych nawet różnic między analizowanymi grupami. W przypadku, gdy zebrane informacje będą zbyt szczegółowe na nasze potrzeby, zawsze możemy je uogólnić schodząc do niższej skali. Jednak kiedy okaże się, że mamy za mało szczegółów nie będzie możliwości podwyższenia skali.

Podczas zbierania danych, musimy pamiętać, że dla wszystkich badanych sytuacja badawcza powinna być identyczna, a przynajmniej jak najbardziej zbliżona.

Uzyskać to możemy między innymi poprzez spisanie instrukcji do badania i odczytywanie jej za każdym razem, by każdy biorący udział usłyszał to samo polecenie. Jeżeli badanie przeprowadza więcej eksperymentatorów, warto kontrolować, która osoba była badana, przez którego badacza, aby mieć możliwość oszacowania w późniejszych analizach wpływu tej zmiennej na wyniki. Dobór do badania może się odbyć na kilka sposobów. Możemy bazować na ochotnikach, co wiąże się z wygodą, ale ma poważne wady metodologiczne. W badaniach psychometrycznych często stosuje się próbę kwotową, czyli taki dobór grupy badawczej, by zachowana została struktura z populacji. Najlepsza z punktu widzenia wnioskowania o zbiorowości generalnej, ale zarazem najtrudniejsza do uzyskania jest próba losowa. Aby ją uzyskać stosuje się różnorodne sposoby losowania. Odnośnie grupy kontrolnej spełniony być musi kanon jednej różnicy. Tylko wtedy wnioskowanie będzie sensowne.

Autorem tekstu jest Martyna Kuligowska.

kpt kuligov 3