Prezes spółki Metodolog.pl Mgr Konrad Hryniewicz

spec. ds. Analiz Statystycznych, Metodologii Badań oraz języka R

Streszczenie

Ze względu na coroczny okres w którym mamy więcej czasu i luzu, Metodolog.pl organizuje szkolenia dla badaczy i praktyków z analiz statystycznych w języku R. Szkolenia są przygotowane w taki sposób, by uczestnicy nie musieli posiadać zaawansowanej wiedzy na temat języka programowania R. Podczas szkolenia jest przygotowana prezentacja oraz autorski kod pozwalający na wykonanie ćwiczeń szkoleniowych. Przygotowany kod jest zrobiony z myślą o dalszych jego modyfikacjach na własny użytek.

Q&A

Dla kogo są poniższe szkolenia?

Dla badaczy zajmujących się badaniami ilościowymi i eksperymentami w naukach społecznych oraz praktyków zajmujących się badaniami rynkowymi.

Koszt szkolenia

Szkolenie jest darmowe.

W jakim terminie odbędzie szkolenie?

Terminy szkoleń będą zasugerowane w arkuszu zgłoszeniowym (na końcu niniejszej prezentacji).

Z czego będzie szkolenie?

Temat szkolenia będzie wybrany w toku głosowania przez osoby zainteresowane.

Czy można się wycofać ze szkolenia?

Oczywiście.

Czy mogę być informowany/a o innych przyszłych szkoleniach?

Tak.

Czy muszę znać język programowania R?

Nie. Na szkoleniu będziemy przyciskać skrót CTR+Enter dla poszczególnych elementów przygotowanego kodu w R. Przed szkoleniem wyslę instrukcję na której będą opisane detale związane z instalacją programu R i RStudio.

Czy można zaproponować własny temat szkolenia?

Zachęcamy do składania takich propozycji. Na razie mamy plan na szkolenie. Aczkolwiek, chętnie wsłuchamy się w oczekiwania badaczy.

Jak długo będzie trwało szkolenie?

Około 4 godzin zegarowych.

Szkolenie z modelowania równań strukturalnych w pakiecie lavaan

Szkolenie z technik modelowania równań strukturalnych oraz weryfikacji właściwości pomiarowych slak, będzie przeprowadzone w pakiecie lavaan (Rosseel, 2012). Jest to łatwa i przyzwoicie “obkodowana” biblioteka R która umożliwia wykonanie bardzo ciekawych analiz. Pakiet ten oferuje bogate możliwości weryfikacyjne. Dodatkowo będziemy pracować z wizualizacjami (próbki można zobaczyć poniżej) proponowanymi przez pakiet semPlot (Epskamp, 2022) oraz dodatkowymi metodami testowania właściwości modeli strukturalnych (np. trafność różnicowa pomiarów, rzetelność kompozytowa i wiele innych) w pakiecie semTools (Jorgensen et al., 2022).

Model ścieżkowy

Modele równań strukturalnych to metody statystyczne mające na celu oszacowanie sieci przyczynowych związków definiowanych w zgodzie z rozumowaniem badacza (zwykle jest to rozumowanie teoretyczne lub techniczne). Model taki łączączy dwie lub więcej nieobserwowalnych zmiennych, gdzie każda jest mierzona przez pewną liczbę obserwowalnych wskaźników. Nie jest to reguła, że modeluje się zmienne latentne, ale na szkoleniu będziemy takie zmienne modelować.

Rysunek nr 1
Model strukturalny z kontrolą modelu pomiarowego
Nota: Oszacowania w nawiasie przedstawiją błędy standardowe dla współczynników \(\beta\)

Panelowy Model Cross-Laggowy

Na szkoleniu mogę również przedstawić jak analizować przyczynowość w układach z powtarzanymi pomiarami (Anderson & Kida, 1982). Będą to podstawy takiego modelowania, choć metody zaawansowane ang. random interecpt cross-lagged panel model (Hamaker et al., 2015) mogą być poruszone na życzenie ogółu chętnych.

Przykład takiego modelu przczynowego w układzie dla powtarzanych pomiarów prezentuję poniżej:

Rysunek nr 2
Model testujący przcyczynowość w czasie
Nota: Oszacowania w nawiasie przedstawiją błędy standardowe dla współczynników \(\beta\)

Analizy mediacji

Analiza mediacji, to analiza mająca na celu weryfikację mechanizmu (zmienna m) który wyjaśnia relację między przyczyną (zmienna x), a skutkiem (zmienna y). Takie efekty możemy testować zarówno w modelach jednopomiarowych jak i modelach cross-laggowych. W lavaanie efekty mediacyjne nie są wyliczane domyślnie. Trzeba je niestety, w sumie jak w większości pakietów czy programów, wyliczyć. Nie jest to trudne. Po prostu, wymaga to poświęcenia chwili zwiększonej uwagi.

Analizy moderacji

Określenie okoliczności w jakich badane efekty się pojawiają i zanikają to niezbędny element dowodzenia właściwości zachowywania się badanych zjawisk. Na pytanie “Kiedy pojawia się efekt?” pozwala odpowiedzieć analiza moderacji/interakcji. W modelowaniu móżna taką analizę wykonać na kilka sposobów. Pokażę cztery: 1) zbudowanie wektora interakcyjnego; 2) Specyfikacja interakcji na poziomie syntaksu modelu; 3) Technika multi group-analysis; 4) Testowanie różnic w dopasowaniu danych do testowanego modelu z ścieżką równą i różną w różnych grupach.

Konfirmacyjna Analiza Czynnikowa

Analizy kofirmacyjne to techniki pozwalające na weryfikację struktury pomiarowej skal, testów i kwestionariuszy. Poznamy rekomendowany estymator ULSMV dla analizowania skal pomiarowych o charakterze porządkowym lub binarnym (Rhemtulla et al., 2012). Na szkoleniu będą też prezentowane możliwości testowania dopasowania danych do różnych struktur czynnikowych które są prezentowane poniżej:

Rysunek nr 3
Model jednoczynnikowy

Rysunek nr 4
Model Ortogonalny

Rysunek nr 5
Model skośny

Rysunek nr 6
Model czynnika wyższego rzędu

Rysunek nr 7
Model model czynnika spearmanowskiego

Porównywanie modeli czynnikowych

Jak już nieco wspomniałem, ale odpowiemy sobie na pytanie: Który z powyższych modeli jest lepszy?

Modele inwariancji pomiarów

Dzięki analizie poszczególnych poziomów inwariancji pomiarów, odpowiemy na poniższe dwa pytania:

  1. Czy poszczególne właściwości pomiarów są podobne w różnych grupach ludzi?
  2. Czy ludzie w różnych grupach reagują na pomiary podobnie?
  3. Czy rozsądne jest porównywanie grup pod względem pomiaru jeśli reagują one na niego różnie?

Analiza wątków w danych tekstowych w pakiecie quanteda i stm

Badania jakościowe mają taką przewagę nad ilościowymi, że pozwalają nam na żywe i osobliwe przybliżenie się do sedna problemu dzięki wypowiedziom ludzi. Niemniej, jak zmienia się nasze dowodzenie jeśli mamy możliwość ilościowej analizy danych jakościowych i wyciągania nadal jakościowych wyniosków? Na to pytanie odpowiemy sobie na szkoleniu z analizy wątków. Dla zainteresowanych tym tematem bardziej zachęcam do zapoznania się z wynikami badania 1 tutaj https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0238714

Badacze czasem są zainteresowani analizą danych tekstowych np. opiniami o restauracjach pozostawianych w internecie, wypowiedziami polityków na szczytach czy rozwojem wątków badaczych na jakiś temat np. akceptacji technologii lub tematyką kierunów rozwoju danej gałęzi nauki np. materiałoznastwem. Aktualne bogactwo danych tekstowych pozwala na bezproblemowe wykorzystanie ich do analizy dzięki technikom maszynowej analizy tekstu. Szkolenie jakie proponuje w tym kontekście składa się z dwóch tematów:
- 1) Przygotowania wejściowych danych tekstowych w pakiecie quanteda (Benoit et al., 2018) (ang. text preprocessing)
- 2) Określenia ilości i interpretacji wątków które są poruszane w analizowanych tekstach dzięki pakietowi stm (ang. structural topic modeling) (Roberts et al., 2019)

Dodam, że dzęki zaawansowaniu tego pakietu będziemy testować wpłw meta-danych na nasilenie różnych wątków w eksperymencie psychologicznym. Eksperyment na ten moment jest tajemnicą, ale polegał na zmianie wypowiedzi słownych w zależności od manipulacji eksperymentalnej.

Rysunek nr 8
Wyniki analizy wątków w kontekście akceptacji szczepionek

Nota: = Im większe słowo, tym większe prawdopodobieństwo występowania danego słowa w analizowanym wątku; Lewy panel przedstawia pożądanie efektywności; Prawy panel przedstawia zatroskanie bezpieczeństwem.

Bibliografia

Anderson, T. N., & Kida, T. E. (1982). The cross-lagged research approach: Description and illustration. Journal of Accounting Research, 20(2), 403. https://doi.org/10.2307/2490748
Benoit, K., Watanabe, K., Wang, H., Nulty, P., Obeng, A., Müller, S., & Matsuo, A. (2018). Quanteda: An r package for the quantitative analysis of textual data. Journal of Open Source Software, 3(30), 774. https://doi.org/10.21105/joss.00774
Epskamp, S. (2022). semPlot: Path diagrams and visual analysis of various SEM packages’ output. https://CRAN.R-project.org/package=semPlot
Hamaker, E. L., Kuiper, R. M., & Grasman, R. P. P. P. (2015). A critique of the cross-lagged panel model. Psychological Methods, 20(1), 102–116. https://doi.org/10.1037/a0038889
Jorgensen, T. D., Pornprasertmanit, S., Schoemann, A. M., & Rosseel, Y. (2022). semTools: Useful tools for structural equation modeling. https://CRAN.R-project.org/package=semTools
Rhemtulla, M., Brosseau-Liard, P. É., & Savalei, V. (2012). When can categorical variables be treated as continuous? A comparison of robust continuous and categorical SEM estimation methods under suboptimal conditions. Psychological Methods, 17(3), 354–373. https://doi.org/10.1037/a0029315
Roberts, M. E., Stewart, B. M., & Tingley, D. (2019). stm: An R package for structural topic models. Journal of Statistical Software, 91(2), 1–40. https://doi.org/10.18637/jss.v091.i02
Rosseel, Y. (2012). lavaan: An R package for structural equation modeling. Journal of Statistical Software, 48(2), 1–36. https://doi.org/10.18637/jss.v048.i02

Arkusz zgłoszeniowy

Można kliknąć klik lub przekleić niniejszy adres do przeglądarki: http://kanonpojecpsychologicznych.pl/lime/index.php/641285?lang=pl


Prezes spółki Metodolog.pl Mgr Konrad Hryniewicz

spec. ds. Analiz Statystycznych, Metodologii Badań oraz języka R