Ustalenie wielkości minimalnej próbki do modelowania równań strukturalnych PLS-SEM

Ustalenie wielkości minimalnej próbki do modelowania równań strukturalnych PLS-SEM

We wpisie prezentujemy prosty wzór na ustalenie wielkości minimalnej próbki dzięki której, możemy wykryć pożądany przez nas efekt badawczy przy wykorzystaniu modelowania równań strukturalnych metodą PLS. Wpierw zapoznajmy się z podstawowymi pojęciami które pozwolą nam na zrozumienie tego czym jest ustalenie wielkości minimalnej próbki do modelowania równań strukturalnym PLS-SEM.

Moc statystyczna

Moc statystyczna jest prawdopodobieństwem z którym jesteśmy w stanie uniknąć błędu drugiego rodzaju, czyli fałszywego wyniku negatywnego (Czyli odrzucić wyniki które są rzeczywiście znaczące, ale np. w badaniu okazały się nie istotne). Moc jest często oszacowywana jako szczególny współczynnik związku i wielkości próby, dla prób populacyjnych na danym poziomie istotności (zwykle wynoszącym równo lub mniej niż 0,05). Weźmy pod uwagę współczynnik siły związku wykryty przez analizę PLS-SEM.

Załóżmy, że taki test w PLS-SEM jest zdolny do wykrycia istotnej relacji, gdzie współczynnik ścieżkowy jest związany z prawdziwym efektem populacyjnym poziomie β = 0,2 (co jest uważane za prawdziwy współczynnik ścieżkowy w tej populacji). Teraz załóżmy, że test poprawnie wskazuje współczynnik ścieżkowy z dokładnością do 80% kiedy wielkość próby 150 obserwacji jest losowo wybrana z populacji. W tych okolicznościach moc detekcji badanego efektu prawdziwego wynosi 80%.

Wielkość badanego efektu

Wielkość efektu jest miarą wielkości efektu który jest niezależny od wielkości analizowanej próby. Zwykle w modelowaniu równań strukturalnych PLS wykorzystuje się współczynnik β (choć w niektórych przypadkach wykorzystuję się z powodzeniem również R-Kwadrat). Konwencja wskazuje, że β mniejsze bądź równe 0,3, od 0,3 do 0,6 i powyżej 0,6, to efekt odpowiednio niski, umiarkowany i silny efekt.

Minimalna wielkość próby

Minimalna wielkość próby to wielkość próby przy której SEM-PLS osiąga akceptowaną moc (zwykle 0,80). Zwykle zależy ona wielkości efektu związanego z wartością badanej ścieżki między badanymi zmiennymi. Im większa jest wielkość współczynnika ścieżkowego β tym większa jest siła efektu, a tym samym większa jest szansa, że prawdziwy efekt będzie wykryty w małej próbce.  Tak więc wysokie współczynniki ścieżkowe na poziomie populacyjnym (niezależnie od kierunku relacji) będą wymagały bardzo małych próbek dla ich odpowiedniego zidentyfikowania. Jeśli badacz wie (lub czuje), że jego ścieżki β w modelu będą wysokie, to może on rozważyć użycie mniejszej próbki w analizie PLS-SEM. Niemniej jak taką wielkość próby wyliczyć dokładnie?

Wzór na ustalenie wielkości minimalnej próbki do modelowania równań strukturalnych PLS-SEM

Poniżej podajemy wzór jak wyliczyć ustalenie wielkości minimalnej próbki do modelowania równań strukturalnych PLS-SEM. Wzór z jakiego korzystamy zaczerpnęliśmy z tej publikacji (Kock & Hadaya, 2018).

Nmin=(t+z/β)*(t+z/β)

t = to wartość statystyki t (jednostronna) równa 1,645 przy której istotność testu wynosi 0,05

z = to wartość statystyki równej 0,84 do wykrycia efektu na poziomie 0,80

β = to wartość współczynnika ścieżkowego (siła efektu w PLS-SEM)

Nmin = Minimalna liczebność próby

Funkcja do przeklejenia do excela:

=ZAOKR.DO.CAŁK((2,48/β)*(2,48/β))

Pod miejsce β wpisujemy przewidywaną siłę efektu, a resztą zmiennych (t i z) możemy manipulować w zależności od dokładności jaką chcemy uzyskać lub kiedy nie mamy dokładnych przewidywań co do kierunku zależności.

Jeśli nasza przewidywana siła efektu wynosi 0,3 (β=0,3), to znaczy, że minimalna próbka jaką musimy uzyskać wynosi 68 obserwacji (po zaokrągleniu).

Żródło:

Kock, N., & Hadaya, P. (2018). Minimum sample size estimation in PLS-SEM : The inverse square root and gamma-exponential methods, 227–261. https://doi.org/10.1111/isj.12131