LINEAR MIXED MODELS - Liniowe modele mieszane

LINEAR MIXED MODELS – Liniowe modele mieszane

LINEAR MIXED MODELS – Liniowe modele mieszane

Ten artykuł został napisany w celu:

  • przedstawienia sytuacji badawczych w jakich LME (Linear Mixed Model / Liniowy model mieszany) powinien być używany
  • jakie są zalety korzystania z tej metody
  • jak można interpretować wyniki uzyskane tą metodą.

 

LINEAR MIXED MODELS – Liniowe modele mieszane – Dla lepszego zrozumienia modeli mieszanych posłużymy się danymi z badania Winter and Grawunder (2012), które są udostępnione do użytku w sieci. W badaniu tym modelowano wpływ formalności sytuacji w jakiej znalazł się badany (zmienna dwupoziomowa: prośba formalna vs prośba nieformalna) oraz płci badanych na wysokość tonu głosu. Można więc zapisać tworzony model jako:

Wysokość głosu = formalność sytuacji + płeć + błąd pomiaru

W badaniu tym kilkakrotnie dokonywano pomiaru tego samego badanego w tych samej sytuacji (tzn każdy badany udzielał kilku odpowiedzi w sytuacji formalnej i kilku odpowiedzi w sytuacji nieformalnej, choć sytuacje te były zawsze opisywane w różny sposób). W związku z powyższym te odpowiedzi, które pochodziły od tego samego badanego, były w pewnym stopniu powiązane między sobą. Ludzie różnią się zarówno płcią, wyjściową (normalną dla siebie) wysokością tonu jak i plastycznością swojego zachowania w obliczu różnych sytuacji. Tym samym odpowiedzi udzielone przez jednego badanego były bardziej podobne do siebie niż do odpowiedzi udzielonych przez innego badanego. W celu lepszego zrozumienia tego zjawiska zapoznajmy się z grafiką nr 1 prezentującą rozkład wysokości tonu w obrębie badanej grupy.

Liniowe modele mieszane linear mixed models

Grafika 1. Rozkład wysokości tony w badanej grupie.

Na pierwszy rzut oka widać, że wszystkie kobiety (badani, których kod zaczyna się od litery F) charakteryzowały się wyższymi średnimi wysokościami tonu od badanych mężczyzn. Dodatkowo widać, że niektórzy badani charakteryzowali się mały dysproporcjami w prezentowanych wysokościach tonu (wykres skrzynkowy badanego M7 jest najbardziej spłaszczony co sugeruje małą wariancję tonu jego głosu, zaś np. badana F1 charakteryzowała się już wysoką zmiennością tonu).

LINEAR MIXED MODELS – Liniowe modele mieszane. Podsumowując jeżeli w badaniu pomiary w obrębie wybranych skupisk są ze sobą powiązane (jak na przykład kilka pomiarów wysokości tonu u tego samego badanego) mamy do czynienia ze współzależnością pomiarów a więc nie możemy użyć klasycznej ANOVA dla pomiarów międzygrupowych czy analizy regresji, wymagających spełnienia założenia o niezależności.

Sposobem na rozwiązanie problemu występowania zależności w danych jest dołożenie do naszego wcześniej prezentowanego modelu dodatkowego elementu tj. losowego efektu dla badanego. Założymy tym samym, że każdy badany może charakteryzować się różną średnią wysokością tonu.

Wzór na nasz model wygląda teraz tak:

Wysokość głosu = formalność sytuacji + płeć + (1|badany) +  błąd pomiaru

Gdzie (1|badany) oznacza, że każdy badany może się charakteryzować własnym średnim poziomem tonu.

Przejdźmy od razu do wyników jakie otrzymamy po uruchomieniu naszej analizy modelu mieszanego.

Pierwsze na co warto zwrócić uwagę co wydruk z efektami losowymi. W tabeli widać, że zmienność związana z różnymi średnimi poziomami badanych wynosiła 19,58 odchyleń standardowych. Ta wartość sama w sobie jest trudna do interpretacji, natomiast nabiera sensu gdy spojrzymy na wartość nie wyjaśnionej w naszym modelu wariancji (residuals). Nie wyjaśniona wariancja wyniosła 28,98 odchylenia standardowego. Dzięki temu, że w naszym modelu badawczych dokonaliśmy kilkukrotnego pomiaru badanych a następnie wyizolowaliśmy wariancję związaną ze zmienności odpowiedzi wewnątrz poszczególnych badanych, pozbyliśmy się 40% wariancji błędu, która w przeciwnym wypadku zaniżała by trafność naszego modelu.

Tabela

Zestawienie wartości efektów losowych.

Efekty losowe
Groups Wariancja Odchylenie standardowe
Badani 383.3 19.58
Residuals 839.8 28.98

 

Oszacowania efektów stałych interpretuje się tak samo jak w przypadku regresji liniowej. W sytuacji formalnej badani  charakteryzowali się istotnie niższy tonem głosu o 19,42 Hz niż w przypadku sytuacji nieformalnej, oraz mężczyźni charakteryzowali się istotnie niższym tonem od kobiet o 108,21 Hz.

Tabela

Zestawienie wartości efektów stałych.

Efekty stałe:
Oszacowanie SE t p
(Stała) 256,69 12,57 20,43 <0,001
Formalność sytuacji (Formalna) -19,42 6,37 -3,05 <0,001
Płeć (Mężczyźni) -108,21 17,21 -6,29 <0,001

 

Dodatkowo możemy się zapoznać wartościami różnych poziomów wysokości tonu każdego z badanych. Widać, po wartościach z tabeli, iż faktycznie każdy badani faktycznie różnili się między sobą w wysokością tonu, stąd kontrolowanie tej zmiennej jest jak najbardziej słuszne.

Tabela

Zestawienie różnych średnich wartości tonu (Stała) dla wszystkich 6-ciu badanych.

Stała Formalność sytuacji (Formalna) Płeć (Mężczyźni)
F1 243,77 -19,42 -108,21
F2 266,38 -19,42 -108,21
F3 259,94 -19,42 -108,21
M3 282,81 -19,42 -108,21
M4 262,22 -19,42 -108,21
M7 225,05 -19,42 -108,21

 

LINEAR MIXED MODELS – Liniowe modele mieszane   – Modele mieszane pozwalają nam na nakładanie na modeli dodatkowych założeń

np. to, że formalność sytuacji w różny sposób wpływa na różnych badanych (możemy wtedy wprowadzić do modelu random slopes, które umożliwią dodatkowe odciążenie modelu o zmienność wynikającą z losowych różnic między badanymi pod kątem tego w jaki sposób reagują oni na rodzaj sytuacji).

Podsumowując, linear mixed models (mieszane modele liniowe) umożliwiają na weryfikacji modeli pochodzących z badań, w których zakładać można występowanie współzależności między losowymi zmierzonymi czynnikami, np.:

  • w badaniu w których zbadano wpływ różnych czynników chorobywch na pacjenta, pacjenci którzy byli diagnozowani/leczeni przez tych samych lekarzy będą charakteryzowali się współzależnością (lekarze różnią się zdolnościami, specjalizacjami co wpływa na efekty ich pracy)
  • w badaniu w których porównywano tolerancję dzieci w klasach 1-3 szkoły podstawowej na obecność dzieci z obcych kultur w ich klasach, dzieci pochodzące z tej samej klasy (posiadającego tego samego wychowawcę mającego wpływ na sytuacje w klasie) będą charakteryzowały się współzależnością wyników
  • w badaniu w którym zadaniem badanych było przypisanie ich zdaniem najbardziej pasującego głosu (męskiego bądź żeńskiego) do 10 poszczególnych wyrazów (5-ciu o rodzaju męskim oraz 5-ciu o rodzaju żeńskim), odpowiedzi w obrębie każdego pojedydynczego badanego będą wzajemnie powiązane jak i odpowiedzi w obrębie każdego pojedynczego wyrazu będą również powiązane. Jeden badany może mieć większe upowanie w głosie damskim niż męskim, jak i pewne słowa mogą większym stopniu od innych skłaniać badanych do przypisania im takiego a nie innego głosu.

By uwzględnić obecność tych współzależności w modelu, konieczne będzie użycie analizy mix model.

Winter, B. (2013). Linear models and linear mixed effects models in R with linguistic applications. arXiv:1308.5499.

Rola teorii w badaniach wykorzystujących modelowanie równań strukturalnych

Rola teorii w badaniach wykorzystujących modelowanie równań strukturalnych

Rola teorii w badaniach wykorzystujących modelowanie równań strukturalnych.

Rola teorii w badaniach wykorzystujących modelowanie równań strukturalnych jest nieoceniona. Modelowanie równań strukturalnych (sem) jest narzędziem zaprojektowanym by pomóc w wytwarzaniu lepszych teorii, głównie w naukach społecznych. Rygorystyczne używanie SEM jest ważne ponieważ, naukowcy nie chcą wyciągać niemądrych konkluzji. Niemniej dążenie do potwierdzenia teorii pozostaje głównym celem. Żadne pojedyncze badanie nie zapewnia nas, że teoria jest trafna. Raczej robią to starania podejmowane przez społeczność badaczy w czasie.

Ważne argumenty na tematy roli teorii w SEM.

  1. Teorie są wytworem ludzkiego intelektu/wyobraźni i zmierzają do wyjaśnienia danego fenomenu
  2. Trafne teorie są tymi, które ściśle korespondują z rzeczywistością
  3. Wsparcie dla trafności rośnie kiedy akumulują się liczne dowody pochodzące z różnych badań empirycznych
  4. Większość teorii była budowana i testowana bez użycia SEM np. teoria względności
  5. Modelowanie równań strukturalnych jest najbardziej użyteczną dla ilościowych badań w naukach społecznych, które używają zmiennych latentnych
  6. Podobnie jak we wszystkich badaniach, uogólnianie wyników modelowania równań strukturalnych wymaga szczegółowej i logicznej argumentacji, a nie większej ilości analiz statystycznych.

Czemu teoria jest tak ważna w SEM?

Modelowanie równań strukturalnych jest metodą pozwalającą na weryfikowanie/konfirmowanie przewidywań badacza. Aby przyjąć hipotezę o trafności testowanej teorii model strukturalny musi uzyskać zbieżność lub dopasowanie z danymi. Model strukturalny może uzyskać zbieżność z danymi tylko w przypadku kiedy teoria jest trafna oraz kiedy współczynniki dopasowania testowanego układu są na odpowiednim poziomie, a łańcuch przyczyn i skutków w modelu poddaje się logicznemu wyjaśnieniu (np. Na intencję do zachowań zdrowotnych wpływa poczucie własnej skuteczności i pozytywne oczekiwania co do zdrowego stylu życia, intencja z kolei wpływa na samokontrolę, a ta końcowo, na rzeczywiste zachowania zdrowotne i satysfakcje ze zdrowia).

Oczywiście w model strukturalny może być dopasowany do danych, ale logiczna argumentacja takiego modelu nie wytrzyma krytyki np. wzrost i waga wpływająca na wiek osobniczy człowieka.

W przypadku interpretacji wyników modelowania równań strukturalnych tylko i wyłącznie teoria badanego zjawiska (opisująca, wyjaśniająca i przewidująca dany fenomen) ma zasadnicze znaczenie w ocenie poprawności weryfikowanego modelu, uogólnianiu rezultatów i poprawnych konkluzji.

Definicje teorii.

Van de Ven (1989, p487) – Dobra teoria wychodzi poza ustalone empirycznie obserwowane wzorce, czyli jest czymś co stara się wyjaśnić powody wystąpienia tych wzorców.

Whetten (1989, p491) – Teoria tylko i wyłącznie wyjaśnia. Mówi co i jak dostarczać ram dla interpretowania wzorców, rozbieżności lub naszych empirycznych obserwacji.

Gioia and Pitre (1990, p517) – Teoria jest spójnym opisem lub wyjaśnieniem obserwowanych lub doświadczanych fenomenów. Ta nietypowa definicja jest konieczna by objąć szeroki zakres teoretycznych reprezentacji odkrytych w różnych paradygmatach.

Becharach (1989, p498) – W bardziej szczegółowych terminach, teoria może być widziana jako system konstruktów i zmiennych w których konstrukty są związane z innymi poprzez propozycje i zmienne które są związane z innymi poprzez hipotezy. Cały system jest ograniczone przez teoretyczne założenia.

Suddaby (2014, p407) – Teoria jest prostym sposobem narzucania konceptualnego porządku na empiryczną złożoność zjawiskowemu światu.

Honderich (1995, p386) Teoria w nauce jest ogólnym stwierdzeniem (lub hipotezą) z której szczególne wnioski mogą być dedukowane. Dokonywane obserwacje mogą być widziane jako potwierdzające lub falsyfikujące hipotezy.

Peter Seddon (keynote speech1 – The Role Of Theory in Structural Equation Modelling Research) – Teoria jest wiedzą która dostarcza ważnych, dobrze uzasadnionych i jasno ograniczonych wyjaśnień tego, jak działa dana część świata.

 

Opracowania statystyczne do prac doktorskich

Opracowania statystyczne do prac doktorskich

Opracowania statystyczne do prac doktorskich.

Opracowania statystyczne do prac doktorskich to usługi poszukiwane przez doktorantów i pracowników naukowych którzy nie znają się na statystyce i metodach obliczeniowych.

Rozwój doktorantów w swojej dziedzinie nauki sprawia, że nie mają czasu na zgłębianie tajemnic skomplikowanych analiz statystycznych i nowości w technikach obliczeniowych. Dlatego pomoc statystyczna w opracowaniach statystycznych jest chętnie wykorzystywaną opcją przez doktorantów. Profesjonalne wsparcie dla doktorantów dostarczane przez Metodolog.pl jest niesamowitą formą współpracy między naukowcem, a dostawcą rozwiązań statystycznych. Dostarczamy bardzo zaawansowane techniki statystyczne oraz doradztwo w doborze metod obliczeniowych w szerokim spektrum problemów naukowych i metodologicznych.

Opracowania statystyczne do prac doktorskich w Metodolog.pl polegają najczęściej ścisłym powiązaniu celów badawczych w kontekście danych teorii z odpowiednio dopasowanymi modelami analiz statystycznych. Doktoranci zazwyczaj wykorzystują w swoich badaniach techniki i urządzenia o wysokiej dokładności pomiarów, a także wyśrubowane metodologie badań i układów eksperymentalnych. Dane zebrane w ten sposób wymagają odpowiedniej obróbki statystycznej. W Metodolog.pl dysponujemy technikami statystycznymi pozwalającymi na ekstrakcje z danych istotnych informacji przy jednoczesnym kontrolowaniu błędów pomiarowych (modelowanie równań strukturalnych PLS), metodami pozwalającymi na kontrolę zmienności wewnątrzobiektowej (wielopoziomowe modele mieszane), odwzorowywaniem skomplikowanych modeli teoretycznych (modelowanie równań strukturalnych opartych na kowariancji), a także wnioskowaniem Bayesowskim i wielopoziomowym.

Opracowania statystyczne do prac doktorskich

Podsumowując pomoc statystyczną oferowaną doktorantom, możemy powiedzieć, że dysponujemy bardzo zaawansowanym warsztatem i doświadczeniem wpływającym na jakość nauki produkowanej przez naukowców. Dzięki naszej współpracy młodzi adepci mogą osiągnąć lepsze wnioski oraz dokładniejsze wglądy w zbierane dane.

Opracowania statystyczne do prac doktorskich i pomoc naukowa przez nas oferowana zawiera w sobie:

  • pomoc metodologiczną
  • ocenę potencjału i wykonalności projektu
  • doradztwo w wykorzystaniu odpowiednich metod statystycznych
  • wsparcie w konceptualizacji modeli koncepcyjnych pod wykorzystanie odpowiednich metod modelowania równań strukturalnych
  • tłumaczenie zalet i ograniczeń metod analizy danych
  • merytoryczną ocenę i recenzję projektów badań
  • pomoc statystyczną w kontekście doradztwa i wykorzystaniu odpowiednich metod statystycznych
  • wykonanie analiz
  • opis wyników
  • krytykę otrzymanych wyników

Co musi dostarczyć nam doktorant, abyśmy mogli rozpocząć pracę?

  1. Od doktorantów potrzebujemy skróconego dokumentu przedstawiającego wprowadzenie do badanego zagadnienia. Powinien on zawierać opis teorii badanego zjawiska. Na jego podstawie jest dokonywana ocena danych, interpretacja konstruktów i powiązanych z nimi hipotez badawczych.
  2. Musimy wiedzieć jakie zmienne zostały zebrane oraz jaka jest ich funkcja w weryfikacji przewidywań. Na podstawie takiej listy możemy dokonać dopasowania odpowiednich metod analizy danych do logiki przewidywań.
  3. Dzięki takiemu podejściu do pracy możemy maksymalizować szanse na to, że projekt zakończy się sukcesem, będzie zrobiony w czasie i nie będzie zagrożony niepotrzebnymi kosztami ze strony klienta.

Potrzebujesz konsultacji? KLIK

Konsultacje statystyczne i doradztwo

wybór między PLS SEM a CB SEM

Modelowanie równań strukturalnych – wybieranie między PLS SEM, a CB SEM

Modelowanie równań strukturalnych – wybieranie między PLS SEM, a CB SEM

Modelowanie równań strukturalnych – wybieranie między PLS SEM, a CB SEM jest niezwykle ważną decyzją. Popularność modelowania wzrasta w badaniach akademickich w wielu dyscyplinach i jest uważana jako jedno z najważniejszych osiągnięć statystycznych w naukach społecznych. Bez wątpienia, modelowanie równań strukturalnych prezentuje kilka charakterystyk które przyciągają badaczy. Wynika to z faktu, że poszczególne pytania badawcze mogą być analizowane w pojedynczym, systematycznym i wszechstronnym modelu analizy statystycznej poprzez generowanie związków pomiędzy wieloma niezależnymi i zależnymi konstruktami jednocześnie. Co więcej, sama analiza nie tylko ocenia model strukturalny, ale także model pomiarowy. Takie połączenie analiz pozwala na pomiar błędów obserwowalnych zmiennych jako integralną część modelu, co sprawia że oszacowania dostarczone przez SEM są lepsze niż te dostarczane przez klasyczną analizę regresji. Badacze stosujący SEM mogą wybierać pomiędzy CB-SEM (covariance based) lub podejściem wariancyjnym, znanym jako PLS-SEM (partrial least squares).

Każde podejście ma różne założenia i cele.

Założenie CB-SEM ma na celu odtworzenie teoretyczną macierz kowariancji bez skupiania się na wyjaśnionej wariancji, podczas gdy PLS-SEM ma na celu maksymalizowanie wyjaśnianej wariancji konstruktów. PLS-SEM ma mniej restrykcyjnych założeń  niż CB-SEM. Obie metody są bardziej komplementarne niż konkurujące ze sobą. Każda z nich ma swoje wady i zalety w kontekście testowania modeli teoretycznych. Najważniejszym powodem wyboru CB-SEM lub PLS-SEM jest cel badawczy, czyli struktura lub predykcja. Głównym celem CB-SEM jest studiowanie struktury obserwowanego zjawiska, a w przypadku podejścia PLS-SEM jest przewidywanie wskaźników za pomocą rozszerzonych składowych modelu. Zgodnie z tym poglądem Hair i inni (2011; p. 144) rekomendują następujące kroki.

Przedstawiają reguły kciuka dla wybierania pomiędzy modelowaniem równań strukturalnych metodą PLS (partial least squares) a metodą CB (covariance based).

Użyj PLS SEM kiedy:

  • Celem jest przewidywanie kluczowych konstruktów lub ich identyfikacja
  • model strukturalny jest jest złożony (wiele konstruktów oraz wiele wskaźników)
  • Próbka obserwacji jest mała i/lub dane nie są zgodne z rozkładem normalnym
  • Planem jest użycie wyników zmiennej latentnej w następnych analizach

Użyj metody CB-SEM kiedy:

  • Celem jest testowanie teorii, potwierdzenie teorii lub porównywanie alternatywnych teorii
  • Błędy wymagają dodatkowej specyfikacji, takiej jak kowariancja
  • Model strukturalny ma cyrkularne (dwukierunkowe pętle zwrotne) związki
  • Badanie wymaga całościowej oceny według kryteriów dopasowania

Warte uwagi jest to, że według Amaro i współpracowników (2015) oba podejścia modelowania równań strukturalnych zwracają podobne wyniki. Wskazali fakt, że obie metody osiągają porównywalne współczynniki i dopasowanie, w szczególności kiedy modele mają dobre właściwości pomiarowe. W artykule z sympozjum Amaro i inni (2015) przedstawiają, że w ich badaniu PLS SEM generowało wyższe rzetelności i trafność pomiarów, podczas gdy CB-SEM osiągało wyższe współczynniki ścieżkowe β.

Hair, J. F., Ringle, C. M., and Sarstedt, M. 2011. „PLS-SEM: Indeed a Silver Bullet.” Journal of Marketing Theory and Practice 19 (2): 139-151.

Amaro. S., Seabra, C. Abrantes, J. L. „Comparing CB-SEM and PLS-SEM Results” 2nd International Symposium on Partial Least Squares Path Modeling, Seville (Spain), 2015

hipotezy naukowe

Hipotezy naukowe

Hipotezy naukowe

„Hipotezy naukowe, ich związek z problemami.

Hipotezy naukowe. Pewien rodzaj założeń w pracach naukowych nazywamy hipotezami, niekiedy hipotezami roboczymi. Na czym polegają tego rodzaju założenia? Czym różnią się od pozostałych? Jaka jest ich rola w pracy naukowej? Dlaczego o hipotezach mówi się zazwyczaj w przyrodoznawstwie, i to zwłaszcza w naukach opierających się zasadniczo na metodzie eksperymentalnej? Czy hipotezy w naukach nieprzyrodniczych i nie opartych na eksperymentowaniu nie są potrzebne? „Hipoteza” znaczy dosłownie (z grec. „hypothesis”) „podkład” lub „przypuszczenie”. To drugie znaczenie wskazuje w pewnej mierze na rolę hipotez w obrębie założeń pracy naukowej. Hipoteza jest naukowym przypuszczeniem o obecności (istnieniu) da-nego zjawiska bądź jego wielkości, częstotliwości, o jego stosunku do zjawisk innych, o związku zależności danych zjawisk od innych lub o związku pojęć bądź wielkości pojęciowych o znaczeniu ustalającnym. W ujęciu ogólnym jest przypuszczeniem dotyczącym danego przed-miotu badań według jakiejkolwiek kategorii poznania, w szczególności kategorii substancji, przyczyny, jakości, ilości, czasu, przestrzeni itp. W takim ujęciu we wszelkich problemach naukowych do czynienia mamy z jakimiś hipotezami, przynajmniej domyślnie (implicite) w nich tkwiącymi.”

Źródło: Cytat pochodzi z Józef Pieter,  (1967). Ogólna metodologia pracy naukowej. wyd. Zakład Narodowy im. Ossolińskich