Modelowanie równań strukturalnych (analiza ścieżek / SEM )

meto

Modelowanie równań strukturalnych (analiza ścieżek / SEM ) 

Metoda równań strukturalnych, jako najbardziej zaawansowana metoda dowodzenia naukowego, ma swoich zwolenników i krytyków ponieważ posiada bardzo wiele zalet oraz równie wiele wad. Modelowanie równań strukturalnych zawsze rozpoczyna się od poznania podstaw teoretycznych elaborowanego zjawiska, tylko na podstawie wytycznych teoretycznych lub różnych jej wariantów można budować model statystyczny SEM. Do jego budowy niezbędne są przewidywania jakie daje teoria lub bardzo silna intuicja, bez poznania tych wskazań można zbudować model wyjaśniający dopasowany do danych, ale mający niewiele wspólnego z rzeczywistością.

W skrócie, analiza modelowania równań strukturalnych, zwana też analizą ścieżek, daje wgląd w badane zjawisko w jego bardzo zaawansowanym wydaniu. Dzięki zaplanowaniu korelacji w równaniu między zmiennymi wyjaśniającymi, które jednocześnie wpływają na zmienną wyjaśnianą można dojrzeć osobliwy wpływ/korelację każdej zmiennej. Niemniej jednak, przy modelowaniu równań strukturalnych trzeba przygotować się na alternatywne scenariusze planowania ścieżek korelacji/wpływów. Nie zawsze, choć często, teoria przez którą patrzymy na naturę zjawisk daje uchwycić się 1 do 1 w modelu statystycznym. Dlatego warto przygotować odrobinę zmienione struktury przewidywanych korelacji/wpływów, by móc porównywać modele pod względem dobroci dopasowania do danych oraz wyjaśnionej interesującej zmienności. Dzięki analizie ścieżkowej można również badać strukturę testów psychologicznych. W tej odsłonie jest to metoda konfirmacyjna, która potwierdza założenia o strukturze czynnikowej  (Konfirmacyjna Analiza Czynnikowa) walidowanego testu oraz pozwala na budowanie alternatywnych jego wersji, by wybrać ten najlepiej dopasowany do danych.

Dodatkowe informacje o SEM

Modelowanie równań strukturalnych 

Analiza równań strukturalnych ma na celu analizę kształtu i siły zależności mających charakter funkcji liniowych (lub też nieliniowych) pomiędzy zmierzonymi zjawiskami. Podstawowym przykładem modelu strukturalnego jest model regresji liniowej, który wyjaśnia wpływ zmiennej niezależnej na ilościową zmienną zależną.

Sytuacją wyjściową, by modelować strukturę równań liniowych powinna być teoria dotycząca badanego zjawiska i jej przewidywania co do wyników i kształtu relacji. To właśnie ona wskazuje na zależności / wpływy, które powinny być uwzględnione w estymacji modelu. Analiza modelowania równań strukturalnych umożliwia szacowanie zależności przyczynowo skutkowych oraz korelacyjnych. Model taki może być prezentowany za pomocą funkcji, choć najfajniejszą i zarazem bardzo elegancką  formą prezentacji jest układ graficzny.

Dzięki wymodelowaniu logiki zależności i wpływów można szacować teoretyczną postać macierzy wariancji-kowariancji zmiennych budujących model. Szacowanie modelu opiera się na porównaniu oszacowanych parametrów macierzy wariancji-kowariancji wynikających z modelu tak aby była ona podobna do zaplanowanej teoretycznej macierzy wariancji – kowariancji. Nawet w przypadku kiedy zbuduje się model z najlepszych parametrów, ale nie będą one wpływały na dopasowanie to trzeba odrzucić model lub go przekształcić. Oczywiście trzeba pamiętać, że przekształcanie modelu może doprowadzić bardzo szybko do dopasowania modelu do danych, ale może on wtedy nie pasować do wcześniej ustalonych założeń teoretycznych. W momencie kiedy obie macierze do siebie są dopasowane pod względem kryteriów dopasowania (np. RMSEA, GFI, AGFI, Chi Kwadrat, CFI itp) można przyjąć, że model wraz z teorią jest jest znacząco ze sobą powiązany. Wtedy i tylko wtedy można przejść do drugiego kroku analizy jaką jest ocena parametrów opisujących model kierunków i sił zależności/wpływów. W przypadku kiedy model nie jest dopasowany do teorii (danych) metodologia postępowania w zmianie układów równań strukturalnych podrzuca sugestie (analityczne) dotyczące tego jak zmienić model, by uzyskać zadowalające dopasowanie. Sugestie te obejmują dodanie i usunięcie parametrów, niekiedy sugerują też zmianę układu zależności/wpływów. Modelowanie strukturalne to narzędzie do analizy zmiennych ciągłych. Często jednak używa się go analizowania zmiennych zakodowanych na porządkowym poziomie pomiaru. Przy takim  zastosowaniu ów skali warto zatroszczyć się o to, aby rozpiętość skali była możliwie jak największa. Pomiary w analizie równań strukturalnych można podzielić na dwa typy: pierwszym typem są zmienne obserwowalne, a drugim zmienne nieobserwowalne. Zmienne obserwowalne są po prostu zmiennymi w bazie danych. Zmienne nieobserwowalne posiadają składniki losowe, które charakteryzują tę część zmienności modelowanych zjawisk, które nie wyjaśniają zmienne umieszczone w modelu równań strukturalnych. Pozostałe zmienne nieobserwowalne, to pomiary opisujące badane uniwersum zjawisk, które ze względu na swoją naturę wymagają mniej lub bardziej zaawansowanego pomiaru lub obróbki statystycznej. W przypadku nauk o zachowaniu większość pomiarów ma właśnie taką charakterystykę. W tym tekście skupimy się na modelowaniu równań strukturalnych biorąc pod uwagę właśnie zmienne obserwowalne i ewentualnie składniki losowe. Prostym przedstawieniem tej grupy modeli o jakich jest mowa to analiza regresji liniowej. Wzięcie pod uwagę korelacji, co jest możliwe dzięki modelowaniu strukturalnym pozawala przezwyciężyć problem interkorelacji (współliniowości), często spotykanej w tego typu modelach. Chodzi w tym o to, że oszacowania parametrów analizy są zazwyczaj zawyżone ze względu na zbyt mocne powiązanie predyktorów co w konsekwencji zwraca mniejszą istotność oszacowań związków/wpływów zmiennych. W modelach strukturalnych można ponad to analizować nie tylko bezpośrednie, ale także efekty pośrednie (mediacji/supresji) dzięki czemu można szacować modele wielorównaniowe. Modelom strukturalnym ze zmiennymi latentnymi (nieobserwowalnymi) poświęcimy osobny wpis. Niemniej to o czym będzie mowa w dalszych wpisach ma zastosowanie w analizie równań strukturalnych, a także w konfirmacyjnej analizie czynnikowej (Confirmatory Factor Analysis).

W skrócie:

Modelowanie równań strukturalnych posiada potencjał w analizie zjawisk postulowanych przez teorię, czyli powiązania różnych zależności pomiędzy badanymi zjawiskami. Model strukturalny jest skonstruowany z pomiarów ciągłych (skala ilościowa) lub porządkowych (przy zachowaniu założenia o rozpiętości skali) oraz zakłada liniową funkcję zależności pomiędzy zmiennymi. Zmienne te mogą być obserwowane lub latentne (nieobserwowalne), a zależności jakie je łączą mogą mieć charakter przyczynowo-skutkowy lub korelacyjny. Model strukturalny może składać się z bardzo wielu równań, a co za tym idzie, wielu zaawansowanych zależności.

Graf ścieżkowy.

 

analiza modelowania równań strukturalnych, analiza ścieżek, analiza mediacji, moderacji, konfirmacyjna analiza czynnikowa CFA

Przykłady układów równań strukturalnych.

Analizę modelu równań strukturalnych najlepiej jest opisać w postaci graficznej, rysując wykres ścieżkowy. Jego różne składowe najlepiej odzwierciedlają elementy układu zmiennych. Zmienne obserwowalne są zazwyczaj przedstawiane jako kwadraty lub prostokąty, nieobserwowalne zmienne są przedstawiane jako kółka (jest to ekspresja zmiennej latentnej, które ma odzwierciedlenie we wskaźnikach obserwowalnych). Relację przyczynowoskutkową symbolizuje strzałka, kierunek tej zależności jest oznaczony grotem. Element mający dwa groty strzałki, przedstawia kowarancję lub korelację). Wskazuje on zależność pomiędzy zmiennymi (lub obiektami modelu strukturalnego). Każdy element oraz każda strzałka odpowiada jednemu współczynnikowi strukturalnemu. Parametry te opisują moc i kierunek korelacji lub relację przyczynowo-skutkową. Współczynnikami przyczynowo skutkowymi są standaryzowane lub niestandaryzowane współczynniki regresji. Współczynnikami relacji są kowariancje (niestandaryzowana korelacja) lub korelacje (standaryzowana kowariancja).

Niestandaryzowane współczynniki analizy ścieżek informują o tym, o ile jednostek (wyrażonych w danej jednostce pomiaru) zmieni się zmienna zależna, kiedy wyniki pomiaru zmiennej niezależnej wzrosną lub opadną.

Współczynniki standaryzowane w równaniach strukturalnych informują o ile zmieni się wynik zmiennej zależnej (wyrażonej w odchyleniach standardowych) w momencie kiedy wynik zmiennej niezależnej zmniejszy się lub zwiększy o jedno odchylenie standardowe.

Wariancja składnika losowego to zmienność która nie została wyjaśniona przez model.

Współczynnik  R2 (lub inaczej współczynnik determinacji) informuje badacza o tym ile zmienności zmiennej zależnej jest wyjaśniane przez zmienne kontrolowane w układzie równań strukturalnych.