Dane binarne w statystyce

Wstęp do meta-analizy. Pierwsze kroki w statystycznej analizie wielu badań.

meto

 

Meta-analiza jest zbiorem statystycznych procedur używanych w dostarczeniu przejrzystych, obiektywnych i replikowalnych podsumowań odkryć badawczych.

Zaczniemy od wprowadzenia w meta-analizę wraz z wyszczególnieniem wstępnych kroków zawartych w kompletowaniu syntezy badań.

Gane Glass wprowadził termin meta-analiza w odniesieniu do statystycznej analizy szerokiej kolekcji wyników analiz z indywidualnych badań w celu integracji wniosków.  Jak z każdą statystyczną procedurą, meta-analiza ma mocne strony oraz ograniczenia. Niemniej jednak jest ona teraz standardowym narzędziem do dostarczania przejrzystych, obiektywnych i powtarzalnych podsumowań w naukach społecznych, medycynie, edukacji i innych polach nauki.

Systematyczne strategie badawcze.

Przed konstrukcją meta-analizy, pytanie badawcze musi być sformułowane precyzyjnie, te pytania wpłyną w całości na proces meta-analityczny. Tak więc, jak jest w zwykłych badaniach empirycznych muszą być dopracowane kryteria włączania i wyłączania. To dostarczy jasność na to jak wyniki badań będa generalizowane na populację.  Jednym z celów jet  każdej meta-analizy jest zebranie reprezentatywnej próby podstawowych badań, które zapewniają zdefiniowane kryteria ich doboru. Systematyczna strategia badawcza zawiera dwa główne kroki: (1) zdefiniowanie problemu i kryteriów wyborów (włączenia i wyłączenia) oraz (2) wyboru badań.

(1) Kryteria włączenia i wyłączenia.

Definiowanie badania w włączaniu i wyłączaniu powinno być oparte na hipotezie badawczej i pytaniach badawczych. Kryteria włączania i wyłączania mogą potencjalnie wpływać na wyniki badania. Taki więc jest ważne aby były one wyraźne i przemyślane.

(2) Selekcja badań.

Selekcja badań i proces wydobycia danych jest często najbardziej czasochłonnym krokiem w przeprowadzeniu meta-analizy. Proces wyboru badań zwykle zawiera szczególną sekwencję z wstępnego wyszukania do kodowania sił efektu z pojedynczego badania podstawowego. Może być pomocne ustruktyruzowanie procesu przy bazowaniu na 4 krokach (identyfikacja, przejrzenie, kwalifikowanie i włączenie) uszczegółowionych w Meta-Analisis Reporting Standards (MARS), instrukcja jest na stronie (http://www.apa.org/pubs/ authors/jars.pdf)  lub PRISMA (http://www.prisma-statement.org/statement.htm). Powyższe kroki powinny być podwójnie kodowane (np. przez dwie osoby) by zapewnić większa obiektywność i precyzję w procesie selekcjonowania badań.

 

Wyciskanie sensu z Alfy Cronbacha – analiza rzetelności.

meto

 

Wyciskanie sensu z Alfy Cronbacha 

Edukatorzy medyczni próbują stworzyć rzetelne i wiążące testy i kwestionariusze by zwiększyć trafność swoich szacunków i ocen. Trafność i rzetelność są dwoma fundamentalnymi elementami w ocenie narzędzi pomiaru. Narzędzia mogą być konwencjonalną wiedzą, umiejętnością lub stosunkiem testów, symulacji klinicznych albo ankiet kwestionariuszowych. Narzędzia mogą mierzyć pojęcia, zdolności psychomotoryczne albo wartości afektywne. Trafność rozumie się jako stopień w jakim narzędzie pomiaru mierzy to co miało zmierzyć. Rzetelność natomiast traktuje się jako zdolność narzędzia do wykonywania spójnych pomiarów. Powinno się zaznaczyć, że rzetelność narzędzia jest silnie powiązana z jego trafnością. Narzędzie nie może być trafne jeśli nie jest rzetelne. Jednakże, rzetelność narzędzia nie zależy od jego trafności. Jest możliwe by obiektywnie zmierzyć rzetelność narzędzia i w tym tekście wytłumaczymy znaczenie Alfy Cronbacha , najszerzej używanej obiektywnej miary rzetelności.

Liczenie alfy stało się powszechną praktyką w medycznej nauce badawczej kiedy w użyciu są złożone miary pojęcia albo konstruktu.

Dzieje się tak dlatego, że łatwiej jest użyć porównania z innymi szacunkami (np. retest rzetelności szacunków) ponieważ wymaga to zastosowania tylko jednego testu. Jednak pomimo powszechnego używania alfy w literaturze, jej znaczenie, właściwy sposób użycia i interpretacje nie są łatwo zrozumiałe. Dlatego uważamy, że ważnym jest aby wytłumaczyć zasadnicze założenia alfy aby promować efektywne jej używanie. Trzeba podkreślić, że celem tego tekstu jest skupienie się na Alfie Cronbacha jako wskaźniku rzetelności. Alternatywne metody mierzenia rzetelności opierające się na metodach psychometrycznych, takie jak teoria czynnika G albo teoria reagowania na pozycje testowe mogą zostać użyte by monitorować i poprawiać jakość badań OSCE, ale o nich nie będzie tutaj mowy.

Co to jest alfa Cronbacha?

 

Alfa została rozwinięta przez Lee Cronbacha w 1951 by zapewnić miarę wewnętrznej spójności dla testu albo skali; jest to wyrażone liczbą między 0 i 1. Wewnętrzna spójność opisuje stopień w jakim wszystkie pozycje w teście mierzą to samo pojęcie albo konstrukt i stąd jest to połączone ze wzajemnym powiązaniem ze sobą pozycji wewnątrz testu. Wewnętrzna spójność powinna być ustalona, by zapewnić trafność, zanim test zostanie użyty do badań albo celi badawczych. Dodatkowo, rzetelność szacuje pokazaną ilość błędów pomiarowych w teście. Mówiąc prosto, ta interpretacja rzetelności jest korelacją testu samego ze sobą. Podniesienie do kwadratu tej korelacji i odjęcie od 1.00 sprawi, że powstanie wskaźnik błędów pomiaru. Na przykład, jeżeli test ma rzetelność na poziome 0.80, występuje 0.36 zmienności błędu (błąd losowości) w wyniku (0.80×0.80=0.64; 1.00-0.64=0.36). Jeżeli oszacowana rzetelność rośnie, fragment wyniku testu przypadający na błąd będzie malał. Oczywiście rzetelność testu ujawnia efekt błędu pomiarowego dla obserwowalnego wyniku raczej dla grupy badanych niż pojedynczego badanego. By obliczyć efekt błędu pomiaru na obserwowalnym wyniku pojedynczego badanego, musi zostać wyliczone standardowy błąd pomiaru (SEM).

Jeżeli pozycje w teście są ze sobą skorelowane, wartość alfy wzrasta. Jednakże, wysoki współczynnik alfa nie zawsze oznacza wysoki stopień spójności wewnętrznej. To dlatego, że alfa jest również kształtowana przez długość testu. Jeżeli długość testu jest niewystarczająca, wartość alfy spada. Zatem, żeby zwiększyć alfę, więcej pozycji sprawdzających tę samą rzecz powinno zostać dodane do testu. Warto też pamiętać, że alfa jest właściwością dla wyniku testu ze specyficznej próbki badanych. Dlatego badacze nie powinni polegać na wydanych przez alfę oszacowaniach tylko mierzyć ją za każdym razem gdy test jest przeprowadzany.

Użycie alfy Cronbacha

 

Niewłaściwe zastosowanie alfy może doprowadzić do sytuacji, w której test albo skala zostaną błędnie odrzucone lub test zostanie skrytykowany za wygenerowanie niewiarygodnych wyników. By uniknąć takiej sytuacji, zrozumienie powiązanych ze sobą pojęć wewnętrznej spójności, jednorodności lub jednowymiarowości może być pomocne przy używaniu alfy. Wewnętrzna spójność dotyczy wzajemnie powiązanych próbek pozycji testu, podczas gdy jednorodność odnosi się do jednowymiarowości. Mówi się, że miara jest jednowymiarowa jeśli jej pozycje mierzą pojedynczą, ukrytą cechę albo konstrukt. Wewnętrzna spójność jest potrzebnym, ale nie jedynym warunkiem zmierzenia jednorodności czy jednowymiarowości w próbce pozycji testu. Zasadniczo, pojęcie rzetelności zakłada, że jednowymiarowość występuje w próbce pozycji testu, a jeśli to założenie nie jest spełnione, to powoduje duże niedoszacowanie rzetelności. Zostało solidnie udowodnione, że wielowymiarowy test nie koniecznie musi mieć mniejszą alfę niż jednowymiarowy test. Zatem bardziej rygorystyczna wartość alfy nie może być po prostu zinterpretowana jako wskaźnik wewnętrznej spójności.

Analiza czynnikowa może być użyta do określenia wymiarów testu. Inna technika, na której można polegać bywała również używana i zachęcamy czytelnika do zapoznania się z tekstem „Applied Dimensionality and Test Structure Assesment with START-M Mathematics Test” i porównania metod do oceniania wymiarowości i zasadniczej struktury testu.

Dlatego alfa nie tylko mierzy jednowymiarowość zestawu pozycji, ale może być użyta do potwierdzenia czy próbki pozycji są faktycznie jednowymiarowe. Z drugiej strony, jeśli test ma więcej niż jedno pojęcie lub konstrukt, może nie mieć sensu liczenie alfy dla testu jako całości jako że większa liczba pytań będzie niechybnie nadmuchiwała wartość alfy. Zasadniczo dlatego alfa powinna być liczona dla każdego pojęcia, a nie dla każdego testu albo skali. Implikacja podsumowującego badania zawierającego niejednorodne, oparte na case’ie pytania jest taka, że alfa powinna być liczona dla każdego z osobna.

Co ważniejsze, alfa jest osadzona w modelu równoważności co zakłada, że każda pozycja testu mierzy taką samą utajoną cechę na tej samej skali. Dlatego jeżeli wielokrotne czynniki/cechy są podstawą pozycji na skali, jak pokazała analiza czynnikowa, to założenie jest łamane i alfa zaniża rzetelność testu. Jeżeli liczba pozycji testu jest za mała to także złamie założenie o równoważności i zaniży rzetelność. Kiedy pozycje testu spełniają założenie o równoważności modelu, alfa lepiej szacuje rzetelność. W praktyce alfa Cronbacha jest dolną granicą szacunku rzetelności ponieważ niejednorodne pozycje testu mogą łamać założenia równoważności modelu. Jeżeli wyliczenie „wystandaryzowanej pozycji alfa” w SPSS jest wyższe niż „alfa Cronbacha”, dalsze badanie równoważności pomiaru może być niezbędne.

Numeryczne wartości alfy

 

Jak wcześniej wspomniano, liczba pozycji testu, wzajemnych powiązań testu i wymiarowości oddziaływania nad wartością alfy. Są różne doniesienia na temat dopuszczalnej wartości alfy, poczynając od 0.70 aż do 0.95. Niska wartość alfy może być powodowana małą liczbą pytań, słabą wzajemnością powiązań pomiędzy pozycjami albo niejednorodnymi konstruktami. Np. jeżeli niska alfa wychodzi na skutek słabej korelacji pomiędzy pozycjami wtedy niektóre powinny być powtórzone lub usunięte. Najłatwiejszym sposobem by je znaleźć jest przeliczenie korelacji dla każdej pozycji testu z całkowitym wynikiem testu; pozycje z niską korelacją (w okolicach zera) są usuwane. Jeśli alfa jest zbyt wysoka, może to sugerować, że niektóre pozycje są zbędne jako że testują to samo pytanie ale nieco inaczej wyglądają. Rekomendowana jest alfa o maksymalnej wartości 0.90.

Streszczenie

 

Wysokiej jakości testy są potrzebne aby ocenić rzetelność danych zawartych w badaniach naukowych. Na alfę wpływa długość i wymiarowość testu.  Alfa jako wskaźnik rzetelności powinna spełnić założenia o istotnej równoważności. Niska alfa pojawia się gdy te założenia nie są spełnione. Alfa nie mierzy po prostu jednorodności i jednowymiarowości testu, jako że na rzetelność testu działa także jego długość. Dłuższy test zwiększa rzetelność niezależnie od tego czy test jest jednorodny czy nie. Wysoka wartość alfy (>90) może sugerować pewien nadmiar i pokazuje, że test powinno się skrócić.

Wnioski

 

Alfa jest ważnym pojęciem w ocenie diagnozy i kwestionariuszy. Jest ważne by oceniający i badacze oszacowali jej stan by dodać trafności i precyzji w interpretacji danych. Tym niemniej jednak alfa często stosowana jest bezrefleksyjnie i bez odpowiedniego zrozumienia i interpretacji. W tym poradniku spróbowaliśmy wyjaśnić zasadnicze założenia wyliczania alfy, czynniki wpływające na jej wielkość i sposoby na jakie można interpretować jej wartość. Mamy nadzieję, że przyszli badacze będą bardziej krytyczni analizując wartości alfy w swoich badaniach.

 

Bibliografia:

Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16(3), 297–334. https://doi.org/10.1007/BF02310555

Kock, N. (2020). WarpPLS User Manual: Version 7.0 (7th ed.). ScriptWarp Systems.

 

czerwony alarm pogotowie statystyczne

Metaanaliza – Statystyczne podsumowanie wyników wielu badań.

meto

 

Finałem metaanalizy jest powiązanie danych z tych badań, złączenie ich i charaktersytyka ogólnej tendencji lub kierunku wyników tych badań.

Metaanaliza polega na zbiorze informacji o wynikach przeprowadzonych badań mających ze  sobą zbieżną narrację. Często weryfikuje się w ten sposób wiedzę na temat badań klinicznych (w których mała liczność obserwacji zmusza do ostrożniejszego wyciągania wniosków z danych).

Metaanaliza jako metodologia ma w sobie pewną logikę. Oto kroki tej logiki.

– postawiene pytania/problemu badawczego

– wykrycie odpowiednich badań na określony temat

– krytyczna selekcja odpowiednich badań

– ewaluacja i podsumowanie wyników Metaanalizy.

Przed metanalizą należy oszacować poziom i źródła heterogeniczności (braku jednorodności wyników) wyników badań ujętych w metaanalizie.

Do badania jednorodności stosuje się wiele procedur; takich jak metody ocen wzrokowych ( wykres leśny, wykres Galbraitha) lub metod ocen formalnych takich jak test Hartleya, Corhana, Indexu I2).

Najczęściej pojawiającymi się źródłami hetoregoniczności wariancji badań w metaanalizie są:

odmienne metodologie badań

– zróżnicowane próby badawcze

– różnorodne okresy trwania badania

– zróżnicowane wskaźniki i sposoby estymacji wyników

W celu usunięcia tych czynników stosuje się analizę wrażliwości, metaregresję lub analizuje się wyniki w różnorodnych populacjach badań.

Do meta-analiz wykorzystujemy oprogramowanie Comprehensive Meta Analysis CMA, Jasp, Jamovi oraz R.

Dane binarne w statystyce

Statystyka opisowa – statystyczny opis danych.

meto

Statystyka opisowa

Od czego najlepiej zacząć analizę danych, gdy już wszystkie pracowicie wprowadzimy do programu i nie mamy pojęcia co dalej? Musimy się zaznajomić z naszymi danymi i zobaczyć co tak naprawdę udało nam się zebrać i jakie analizy będzie można na tych danych przeprowadzić. Do tego służą nam statystyki opisowe. Statystyka opisowa pozwala nam obiektywnie zobrazować różne aspekty naszych danych liczbowych.

Statystyki opisowe najczęściej dotyczą jednej zmiennej czyli wybranej właściwości z naszego zbioru danych, która przyjmuje co najmniej dwie różne wartości (np. płeć osoby badanej). Zmienne dzielimy na grupy ze względu na ich różne własności. Najpopularniejszym i najbardziej praktycznym podziałem jest podział Stevensa.

Stevens wyróżnił:

  1. Skalę nominalną – mamy tylko kategorię dla osoby badanej
  2. Skalę porządkową – kategorie mogą zostać ułożone od najmniejszej do największej
  3. Skalę interwałową – posiada jednostkę, wiemy o ile obserwacje się od siebie różnią
  4. Skalę ilorazową – posiada zero bezwzględne, wiemy ile razy obserwacje się różnią

Skale interwałowe i ilorazowe nazywamy często łącznie skalą ilościową.

Do podstawowego opisu statystycznego zmiennych stosujemy miary tendencji centralnej i miary rozproszenia.

Miary tendencji centralnej:

DOMINANTA – określa wartość najczęstszą w danym zbiorze, może być stosowana dla każdej skali

MEDIANA – jest to wartość środkowa w uporządkowanym wg wielkości zbiorze, może być stosowana dla skal porządkowych i ilościowych.

KWARTYL – kwartyle dzielą uporządkowaną grupę na cztery równe części

ŚREDNIA ARYTMETYCZNA – wartość przeciętna, ma zastosowanie tylko dla skal ilościowych

Miary rozproszenia:

ROZSTĘP – różnica między maksymalną a minimalną wartością w grupie

ODCHYLENIE ĆWIARTKOWE – jest to różnica między trzecim i pierwszym kwartylem podzielona przez dwa

ODCHYLENIE ŚREDNIE – jest to średnia arytmetyczna bezwzględnych odchyleń pomiarów od średniej arytmetycznej w próbie

ODCHYLENIE STANDARDOWE – jest to pierwiastek z sumy kwadratów odchyleń od średniej poszczególnych obserwacji podzielonej przez liczbę obserwacji. Kwadrat odchylenia standardowego to WARIANCJA – najszerzej stosowana miara zmienności zmiennej

WSPÓŁCZYNNIK ZMIENNOŚCI – jest równy ilorazowi odchylenia standardowego i średniej arytmetycznej. Dla danych porządkowych stosowany jest pozycyjny współczynnik zmienności oparty na medianie i odchyleniu ćwiartkowym. Wartość współczynnika zmienności poniżej 0,5 świadczy o niewielkim zróżnicowaniu, wartości z przedziału 0,5-1 wskazują na umiarkowane zróżnicowanie, a wartości powyżej 1 świadczą o bardzo dużym zróżnicowaniu.

Autorem tekstu jest Marta Mrozek.

Potrzebujesz wsparcia lub usług statystyczno-metodologicznych? Napisz do nas lub zadzwoń. Oferujemy niskie ceny przy badaniach korelacyjnych i prostych eksperymentach!

Władzą jest wiedza o źródłach zmienności Metodolog.pl motto

Analiza statystyczna standardy APA

Współczynnik rzetelności – Alfa Cronbacha.

meto

 

 Alfa Cronbacha jest statystyką. Używa się jej zwykle do mierzenia wewnętrznej spójności albo rzetelności psychometrycznego narzędzia.

 

Innymi słowy, mierzy jak dobrze zestaw zmiennych albo pozycji mierzy pojedynczy, jednowymiarowy ukryty aspekt jednostki. Generalnie, niejedna wielkość zainteresowania medycznego, jak lęk albo poziom niepełnosprawności, są niemożliwe do jednoznacznego zmierzenia. W takich przypadkach, zadajemy szereg pytań i łączymy odpowiedzi w jedną, liczbową wartość.

Co to jest?

 

Na przykład, załóżmy, że chcemy się dowiedzieć jaki jest stopień niepełnosprawności pacjentów cierpiących na mielopatię szyjki macicy.

Najpierw przygotujemy tabelę z 10 pozycjami rejestrującymi poziom trudności napotykanych przy wykonywaniu codziennych czynności. Każda pozycja jest oceniana od 1 co znaczy „bezproblemowo” do 4 co oznacza „niewykonalne”. Zsumowany wynik z tych 10 pozycji da nam ostateczny rezultat.

Jednakże, kiedy pozycje są użyte by stworzyć skalę, muszą być wewnętrznie spójne. Każda z pozycji powinna mierzyć tę samą rzecz, więc powinny być one ze sobą skorelowane. Alfa Cronbacha generalnie wrasta gdy korelacje pomiędzy pozycjami wzrastają. Z tego powodu, współczynnik jest także nazywany spójnością wewnętrzną albo wewnętrzną spójnością rzetelności dla testu.

Zakres

 

Wartość alfa (α) może się znajdować pomiędzy minus nieskończonością a 1. Jednak, tylko dodatnia wartość (α) ma sens. Generalnie, współczynnik alfa ma zakres od 0 do 1 i może zostać wykorzystany do opisania rzetelności czynników wydobytych dychotomicznie (czyli pytań z dwoma możliwymi odpowiedziami) i/albo kwestionariuszy lub skali sformatowanych wielopunktowo (np. skala oceny 1=biedny, 5=wyśmienity).

Niektórzy znawcy nalegają by wynik rzetelności wynosił 0,7 albo więcej w czasie używania psychometrycznego narzędzia. Ta zasada powinna być stosowana ostrożnie gdy (α) ma być liczona z pozycji, które nie są skorelowane.

Zastrzeżenia

 

Pomimo, że Alfa Cronbacha jest dzisiaj szeroko stosowana, jest związanych z nią kilka problemów.

 

Pierwszym problemem jest to, że alfa jest zależna nie tylko od wielkości korelacji pomiędzy pozycjami, ale także od liczby pozycji na skali. Skala może sprawiać wrażenie „homogenicznej” poprzez zwykłe dublowanie liczby pozycji, nawet jeżeli średnie korelacji pozostaną niezmienne.

 

To prowadzi prosto do drugiego problemu. Jeżeli mamy dwie skale z których każda mierzy odrębny aspekt, i połączymy je by stworzyć jedną długą skalę, alfa prawdopodobnie będzie wysoka, chociaż połączona skala w oczywisty sposób dotyka dwóch różnych atrybutów.

 

Po trzecie, jeśli alfa jest zbyt wysoka, może to sugerować nadmierną ilość pozycji, to znaczy, pozycji zadających to samo pytanie w odrobinę inny sposób. 

 

Więcej informacji na:

Analiza rzetelności

Analiza statystyczna danych do pracy doktorskiej

Rzetelność Pomiaru

Psychometria 2

Model połówkowy – Analiza rzetelności

Analiza danych statystycznych opracowanie statystyczne badania ankiety danych historycznych

Wprowadzenie do analizy równań strukturalnych. Analiza ścieżek / SEM / SEPATH

Statystyczna analiza danych w psychologii

Usługi statystyczne pomoc statystyczna

Pomoc statystyczna dla doktorantów. Czy taka pomoc jest niezbędna?