ceny usług analiz obliczeń statystycznych

Hackowanie wartości p, problemy z istotnością statystyczną, nadużycia i możliwe rozwiązania

Istotność statystyczna i problemy z jej raportowaniem.

Istotność statystyczna jest miarą prawdopodobieństwa błędnego odrzucenia hipotezy zerowej przez eksperymentatora, jej symbolem jest litera alfa pisana mała literą. Niskie wartości alfa oznaczają, że wynik powstał przez przypadek. Testując hipotezy we właściwy sposób, zakładamy krytyczną wartość alfy zanim zbierzemy dane. Musimy zawrzeć kompromis między istotnością a mocą testu (tzn. prawdopodobieństwem, że hipoteza zerowa zostanie odrzucona, w przypadku gdy jest fałszywa). Niskie wartości alfy oznaczają, że błędne odrzucenie zerowej hipotezy jest mniej prawdopodobne, ale również ogólnie spada szansa jej odrzucenia. Zwiększając wielkość próby, zwiększamy istotność bez zmniejszania mocy testu.

Słowo „istotny”, w tym znaczeniu, nie oznacza „duży” bądź „ważny” jak ma to miejsce w codziennym użyciu tego słowa. Oznacza ono, że efekt jest wystarczająco duży, że nieprawdopodobnym wydaje się, by wystąpił wyłącznie przez przypadek. Efekty istotne statystycznie mogą być w rzeczywistości bardzo niewielkimi, chociaż duże próby są wymagane by wykazać istotność małych/słabych efektów.

W wielu podejściach statystycznych, istotność statystyczna jest omawiana w przypadku raportowania wyników testowania hipotez. Hipoteza alternatywna (informująca, że efekt występuje) jest przyjmowana, a zerowa hipoteza (informująca, że efekt nie występuje) jest odrzucana – wtedy, kiedy wyniki testu wskazują, istotne odstępstwo od hipotezy zerowej. Jeśli istotna różnica nie występuje, hipoteza zerowa nie jest odrzucana, choć nie jest to równoznaczne z jej przyjęciem. W większości przypadków, nie odrzucenie hipotezy zerowej jest słabym dowodem do uznania jej prawdziwości.

WARTOŚĆ ALFA vs WARTOŚĆ P

Testowanie hipotez składa się z następujących kroków: formułowanie hipotezy zerowej i alternatywnej, wybieranie krytycznej wartości alfa, wybieranie obszaru wykluczenia, zbieranie danych, obliczanie statystyk i ocenianie czy statystyki mieszczą się w obszarze wykluczenia. Występują cztery możliwe rezultaty testowania hipotez: hipoteza zerowa jest prawdziwa i nie jest odrzucona, hipoteza zerowa jest fałszywa i odrzucona, hipoteza zerowa jest prawdziwa ale odrzucona oraz hipoteza zerowa jest fałszywa ale nie jest odrzucona. Jeśli hipoteza zerowa jest prawdziwa ale odrzucona, mamy do czynienia z błędem I rodzaju. Jeśli hipoteza zerowa jest fałszywa ale nie jest odrzucona, mamy do czynienia z błędem II rodzaju. Prawdopodobieństwo wystąpienia błędu I rodzaju, jest z definicji równe wartości alfa. Prawdopodobieństwo wystąpienia błędu II rodzaju nie może zostać wyliczone, jeśli alternatywna hipoteza nie posiada znanego rozkładu.

Jeśli możliwe wyniki eksperymentu mogą zostać uporządkowane od tych „najbardziej prawdopodobnych” (hipoteza zerowa) do „najmniej prawdopodobnych”, wtedy rzeczywiste wyniki mogą zostać przypisane do wartości równej prawdopobieństwu ich wystąpienia wraz z tymi wynikami, które są jeszcze mniej prawdopodobne. To prawdopodobieństwo nazywane jest „wartością p”. Jeśli wartość „p” jest mniejsza od wartości alfa, odrzucamy hipotezę zerową. Istotność testu jest determinowana przez wartość alfa, która jest niezależna od wyników testu. Jedynym wywieranym efektem przez wartość p jest odrzucanie hipotezy zerowej, gdy wartość alfa jest większa od wartości p, bądź nieodrzucanie hipotezy zerowej, gdy wartość alfa jest mniejsza od wartości p. Wynik nie staje się bardziej statystycznie istotny jeśli wartość p jest znacznie mniejsza od wartości alfa w porównaniu do wartości niewiele mniejszej od wartości alfa.

NADUŻYCIE

Z nadużyciem mam do czynienia gdy dziennikarze bądź pewne instytucje ignorują koncept istotności – prowadząc do błędnych informacji później upublicznianych. W 2005 r. raport stworzony przez brytyjski rząd podsumował, że nie odnotowano „istotnego wzrostu używania narkotyków w brytyjskich szkołach”. Kilka gazet zabrało się za wyciąganie swoich własnych wniosków. W ich absolutnie amatorskim sposobie analizy raportu, odnotowali, że wzrost użycia kokainy w szkołach wzrósł z 1% do 2% – mimo, że wartości te w raporcie zostały zaokrąglone dla potrzeb podsumowania i w rzeczywistości wynosi odpowiednio 1,4% oraz 1,9%. Mieliśmy więc do czynienia ze wzrostem na poziomie 35% a nie 100%.

Znaleźli więc chwytliwy temat do nagłówka; w przeciwieństwie do orzeczenia rządu, zużycie kokainy wzrosło dwukrotnie, zalewa szkolne podwórka, co rząd próbuje ukryć. Jednakże, rządowe wnioski były bardziej dokładne, ponieważ brały pod uwagę istotność, grupowanie i fakt, że wiele różnych narkotyków było ankietowanych. Jeśli testujesz wiele zmiennych, szansa, że jedno z nich wykaże jasny trend przez przypadek rośnie, stąd też testy istotności muszą być odpowiednio zmieniane. Gdy rzeczywiście wykonano niezbędne matematyczne analizy, wspomniane wcześniej wyniki okazały się być absolutnie nieistotne. Przypadek sprawił, że próba w większym stopniu niż w  populacji, składała się  z osób zażywających kokainę.

PROBLEMY ZE STATYSTYCZNĄ ISTOTNOŚCIĄ

Wartość alfa jest z reguły ustalana na poziomie 0.05 bądź mniejszym. To oznacza, że występuję mniej niż 5% szansy na to, że odrzucimy hipotezę zerową przez sam przypadek. Jeśli test zwróci wynik p=0.04, wynik nazywany jest istotnym, zaś jeśli zwróci wynik p=0.06 wynik jest nieistotny.

Skutkiem ubocznym tej standardowej wartości alfa jest fakt, że 1 na 20 wyników będzie istotny, podczas gdy i tak nie kryje się za nim żaden efekt. To zdarza się często, więc błędem jest zakładać, że odpowiednia wartość „p” oznacza, że możesz być absolutnie pewien słuszności otrzymanego wyniku, to dalej jest kwestią prawdopodobieństwa. W pojedynczym eksperymencie, w którym przeprowadza się wiele testów statystycznych jest to poważny problem, np. gdy przeprowadzasz 40 testów, ok. 2 z nich odnotuje występowanie efektu, którego tam w ogóle nie ma. Jest to często nazywane współczynnikiem FWER (family wise error rate), który ciężko kontrolować, choć istnieją pewne miary w tym pomocne.

Podczas gdy łatwo zaobserwować ten problem w pojedynczym eksperymencie, to samo zjawisko pojawia się grupie pojedynczych eksperymentów publikowanych w wielu magazynach. W tysiącach eksperymentów prowadzonych każdego dnia na cały świecie, wiele z nich wyjawi statystyczną istotność, podczas gdy efekt w rzeczywistości nie występuje. Publikatorskie uprzedzenia rozdmuchują ten problem z powodu niechęci do publikowania eksperymentów, które odnotowują tylko brak efektu (tj nieudane eksperymenty), a znacznie chętniej eksperymenty z efektami.

NADUŻYCIA PSEUDONAUKI

To jest powodem dlaczego wybieranie pojedynczego wyniku testu z wybranego artykułu by coś wywnioskować jest bezsensowne. Jest to powszechna taktyka w pseudonaukach by przeszukiwać tysiące badań by znaleźć jeden istotny wynik potwierdzający ich założenia. Prawdziwej nauce musi towarzyszyć przewaga dowodów, a wyniki eksperymentów muszą być wielokrotnie i rzetelnie powtarzane zanim zostaną wcielone do zasobów pewnej i uznanej wiedzy.

Problemu omawiane powyżej są spowodowane przez używanie częstościowego podejścia w analizie statystycznej. Powstaje coraz większe grono naukowców korzystający ze statystyki w ujęciu Bayesowskim.

 „Łowienie wartości „p”” inaczej „p-hacking”

Łowienie wartości p (z ang. „p-value fishing”), bardziej znane jako „p-hacking” jest pejoratywnym zwrotem dla statystycznego kuglarstwa uprawianego przez tych, którzy w nie do końca czysty sposób chcą promować swoje hipotezy. Są dwa sposoby by otrzymać statystycznie istotny wynik, który nie oznacza w sumie niczego. Pierwszy z nich jest używany w badaniach z dużą liczbą zmiennych, kiedy wykonuje się porównania wszystkich zmiennych ze sobą w nadziei, że któryś wynik okażę się istotny.

Prawidłowo metodologia nakazuje, by eksperymentator wybrał, które zmienne będą porównywane najpierw, a także, by dokonywać korekt post-hoc w każdym dalszym porównaniu. Innym słowy, zwykłe porównywanie maksymalnie dużej liczby zmiennych, przyniesie nam statystycznie istotne wyniki, w które w rzeczy samej będę statystycznym szumem. Korekty post-hoc albo zmniejszają wartość alfa testów post-hoc, albo zwiększają ich wartość „p”, dzięki czemu poziom FWER jest utrzymywany.

Drugim sposobem na tzw „p-hacking” jest podkręcanie liczby badanych osób aż do momentu, w którym istotność jest osiągnięta. Przeważnie dobrze jest mieć większą liczbę osób badanych, jednakże dane powinny być analizowane w ich świetle. To co się często dzieje z dużą liczbą osób badanych jest to, że nawet drobna różnica w średnich stanie się istotna nawet jeśli wielkość efektu jest bliska zeru. Dlatego należy przyglądać się również wielkości efektu przy zaznajamianiu się z wartościami „p”.

Możliwe rozwiązania problemu

Innym rozwiązaniem było argumentowanie, ze statystyki muszą stracić swój magiczny status w nauce jako pewnego rodzaju analogia do dowodzenia i raczej należy widzieć je jako argument lub miarę siły dowodzenia. Wartość statystyki „p” jest wycinkiem większej całości i powinna być równoważono innymi rodzajami dowodów. Wartość „p” może być raportowana bezpośrednio, pozwalając nam na integrowaniu tej informacji z innymi dowodami w tworzeniu konkluzji. Jeśli inne dowody są słabe, być może wartość p na poziomie 0.05 jest nie przekonywująca, a być może gdy inne dowody są silne wartość „p” na poziomie 0.1 jest wystarczająca wysoka.

Jednakże, jest to problematyczne, jak samo obchodzenie się z wartością „p”, które otwiera wiele możliwości do wielu błędów statystycznych, jak mnożenie statystyk „p” dwóch badań w celu otrzymania sumarycznego „p”.

Skupianie się na przedziałach ufności zamiast na wartościach „p” zapewnia większą elastyczność i mniejszą arbitralność w ocenianiu dowodów. 95% przedział ufności może być interpretowany jako odrzucanie hipotezy zerowej pewnych wartości znajdujących się poza granicą przedziału znajdującą się w punkcie alfa 0.05. Jednakże, ten sam przedział pozwala na interpretowanie wartości w dopuszczalnym przedziale i decydować o wystarczającym precyzji by mu ufać. Szeroki przedział ufności związany z niskimi wartościami „p” może być mniej użyteczny niż wąski, bardziej dokładnym przedział ufności, któremu nie udaje się odrzucić hipotezy zerowej.

Może cenniejsze stanie się raportowanie większej ilości replikowalnych badań?

Dobre, złe i istotne statystycznie

założenia regresji logistycznej

 

Czy w psychologii występuje kryzys replikacji ze względu na trudności związane z interpretacją wartości istotności statystycznej?

Wszystko o wartości p

Amerykańskie Towarzystwo Statystyczne właśnie uwidoczniło obarczenia w temacie p-wartości, w pierwszym w historii oficjalnym oświadczeniu o praktyce statystycznej. Jest nadzieja zwłaszcza dla naukowców i dziennikarzy, którzy nie bardzo rozumieją, co oznacza wartość p. Watch Alison, McCook opisuje krótko i robi wywiad z Ronem Wasserstein, dyrektorem wykonawczym ASA.

W swojej odważnej próbie na Explainer w FiveThirtyEight Christie Aschwanden zauważa, że roczna praca ASA nad oświadczeniem pozostawiła metaforyczną krew na podłodze. Co sugeruje, że statystycy sami nie zgadzają się na to, czym jest wartość p i co robi.

Pierwszym zadaniem było zdefiniowanie terminu. Aschwanden mówi, „w końcu zgodzili  się w tej sprawie:” Nieformalnie wartość p jest prawdopodobieństwem na podstawie określonego modelu statystycznego, który statystyczne podsumowuje dane (na przykład próbka oznaczająca różnicę między dwoma porównywanymi grupami) będzie równa lub bardziej ekstremalna niż obserwowana wartość „definicja ta jest jasna jak słońce” Ona stoicyzmem stoi przy jej deklaracji w poście z ostatniego upadku: „Doszedłem do wniosku, że najbardziej podstawowym problemem z p-wartością jest to, że nie  można naprawdę powiedzieć, jaka jest. „

Nie ma mowy abym mógł adekwatnie podsumować posty Aschwanden. Jeśli trzeba zrozumieć te rzeczy, aby zrobić swoją pracę, trzeba je przeczytać. Prawdopodobnie w oświadczeniu ASA oraz 20 komentarzach jest od statystyków jest tak samo. Podobnie w wycofaniu Watch Wasserstein.

Ale zostawię cię z tymi najbardziej podstawowymi uwagami:

Od Aschwanden: „Wspólnym nieporozumieniem jest to, że wśród nie statystyków jest to, że wartość p może pokazać Ci prawdopodobieństwo, że wynik osiągnięty zostanie osiągnięty. Taka interpretacja jest całkowicie błędna. Wartość p tylko mówi Ci coś o prawdopodobieństwie. Widząc konkretne hipotetyczne wyjaśnienie – nie można powiedzieć, że wyniki są prawdziwe, czy przypadkowe”.

Wykres pogodowy Metodolog

Ogół społeczeństwa nie ma pojęcia, co oznacza „istotne statystycznie”

Metodolog - statystyczna analiza data minig

Metodolog.pl – Analiza Statystyczna w nauce

Firma statystyczna METODOLOG

Ogół społeczeństwa nie ma pojęcia, co oznacza „istotne statystycznie”

Tytuł tego wpisu nie powinien szokować kogoś, kto miał zajęcia podstawowe ze statystyki. Statystyka jest pełna terminów, które mają szczególne znaczenie statystyczne oprócz codziennego znaczenia.

Kilka przykładów:

Znaczące, zaufanie, moc, losowe, średnia, krzywa normalna, wiarygodne, chwila, uprzedzenia, interakcja, prawdopodobieństwo, błąd, obciążenia, ciężary, niebezpieczeństwo, ryzyko, bootstrap, informacje, jack-knife, jądro, niezawodne ważności; a to tylko wierzchołek góry lodowej. (Oczywiście im lista robi się dłuższa, tym więcej lekcji statystyki trzeba podjąć).

Nie powinno dziwić, że błędy ludzi w znaczeniu terminologii statystycznej  dotyczą zwykle znaczenia angielskiego, kiedy prawie każde słowo ma jakieś podwójne znaczenie.

Philip Tromovitch (2015) niedawno wypuścił zgrabny artykuł, w którym przetestował nieco ponad 1000 członków ogółu społeczeństwa na ich rozumienie znaczenia „istotność”, termin, który ma bardzo precyzyjną definicję statystyczną: przy założeniu hipotezy zerowej jest prawdziwy (zwykle definiowany jako brak efektu).

Jednak w codziennym języku angielskim, coś, co jest istotnym oznacza, że jest godne i warte naszej uwagi. Zamiast podać oczywistą definicję słownika, zapytałem mamę, co myśli. Powiedziała, że interpretuje wyrażenie, takie jak „nastąpił znaczny spadek sprzedaży od 2013 do 2014”, że spadek sprzedaży był „dość duży, istotny.” (Dzięki mama :)) Ale to tylko jeden osoba. Co myślą respondenci badania Tromovitch?

Tromovitch zbadał w sumie 1103 osób. Poprosił 611 swoich respondentów o odpowiedź na pytanie wielokrotnego wyboru, a reszta odpowiedziała na wariant  pytań otwartych. Oto pytanie wielokrotnego wyboru jego respondentów:

  • Kiedy naukowcy deklarują, że odkrycie w ich pracy jest „istotne”, które z poniższych uważasz, że jest najbliższe temu co mówią:
  • Stwierdzenie: jest duże
  • Stwierdzenie: jest ważne
  • Stwierdzenie: jest inne niż by się tego spodziewano przypadkowo
  • Stwierdzenie: było nieoczekiwane
  • stwierdzenie: jest bardzo precyzyjne
  • stwierdzenie: opiera się na dużej próbce danych

Respondenci, którzy wybrali dwie pierwsze odpowiedzi uznano, że niewłaściwie używają języka angielskiego, wybranie trzeciej odpowiedź zostało uznana za poprawne, a wybranie którejkolwiek z finałowej trójki uznano za błędne odpowiedzi. Oddzielił respondentów posiadających stopień doktora (n = 15) od reszty, ale nie otrzymał żadnej informacji na temat tego, co było w jakiej dziedzinie byli doktorami, więc będę po prostu zapoznawać się z pozostałymi wynikami próbek od tego momentu, ponieważ próbkę dotyczącą doktorów należy traktować z przymrużeniem oka.

Mniej więcej 50% respondentów dało ogólno-angielską interpretację „znaczące” (opcje 1 lub 2), z grubsza 40% wybrało jedną z pozostałych trzech błędnych odpowiedzi (opcje 4, 5 lub 6), a mniej niż 10% w rzeczywistości wybrało prawidłową odpowiedź (opcja 3). Nawet gdyby były one całkowicie zgadywane, czego można oczekiwać, żeby zbliżyć się do 17% prawidłowej (1/6).

Ale chyba format wielokrotnego wyboru nie jest najlepszym sposobem, aby otrzymać wyniki, ponieważ test zapewnia wiele odpowiedzi, które brzmią zupełnie rozsądne. Tromovitch zadał to również jako pytanie otwarte, aby zobaczyć, jakiego rodzaju odpowiedzi ludzie generują sami. Jeden wariant testu wyraźnie mówi, że chce wiedzieć o istotności statystycznej, a drugi po prostu wymienia znaczenie. Dokładne sformułowanie brzmiało:

Naukowcy czasem twierdzą, że odkrycie w ich pracy jest „[statystycznie] znaczące.” Jeśli byś zaktualizował słownik angielskiego nowoczesnym amerykańskim, w jaki sposób zdefiniował byś pojęcie „[statystycznie] znaczące„?

Czy respondenci odpowiedzieli lepiej, kiedy mogli odpowiadać swobodnie? Wcale nie. Żaden test nie miał wysokiego wskaźnika sukcesu; udzielili poprawnych odpowiedzi na około 4% i 1%. To przekłada się na dosłownie 12 poprawnych odpowiedzi na ogólną liczbę 492 respondentów obojga monitów łącznie (w tym reakcje PHD). Tromovitch bierze pod uwagę wszystkie te odpowiedzi w dodatku, dzięki czemu można przeczytać rodzaje odpowiedzi, które zostały podane i uznane za poprawne.

Jeśli spojrzeć na odpowiedzi można zobaczyć, że większość z nich oznacza jakieś oświadczenie o prawdopodobieństwie prawdziwości jednej lub drugiej hipotezy, co jest niedozwolone w wyniku prawidłowego określenia istotności statystycznej! Na przykład, jedna odpowiedź kodowana jako prawidłowa jak powiedział, „Prawdopodobieństwo, że wynik / ustalenia nie są dziełem przypadku i prawdopodobnie prawdą” jest rażąco błędne. Prawdopodobieństwo, że wyniki nie są dziełem przypadku, nie jest tym o czym mówi nam znaczenie statystyczne. Większość odpowiedzi zakodowanych jako „poprawne” przez Tromovitch jest dość niejasnych, więc nie jest to oczywiste, że nawet w tych poprawnych Respondenci mają dobry uchwyt koncepcji. Nic dziwnego, że opinia publiczna patrzy na statystyki, jak gdyby była jakąś magia. Nie rozumieją ich w ogóle.

To co wyniosłem z tego badania to tytuł tego kawałka: ogół społeczeństwa nie ma pojęcia co oznacza istotność statystyczną. To nie jest zaskakujące, jeśli wziąć pod uwagę, że badacze sami często nie wiedzą, co to znaczy! Nawet profesorowie uczący metod badawczych i statystyk robią to źle. Wyniki Haller & Krauss (2002), budynek off Oakes (1986) sugerują, że to jest normalne dla studentów, pracowników naukowych, a nawet instruktorów metodycznych, że wprowadza się błędne interpretacje p-wartości i testów istotności. To bardzo źle.  Normalne, że studenci pierwszego roku lub laicy się mylą, ale wykształceni naukowcy i instruktorzy metodologii? Jeśli nie kupujesz wyników badań, otwórz czasopismo psychologiczne, a znajdziesz mnóstwo przykładów błędnej interpretacji i nieporozumień.

Ostatnio Hoekstra, Morey, Rouder, & Wagenmakers (2014) wykazali, że przedziały ufności są podobnie błędnie interpretowane przez badaczy, pomimo ostatnich głosów (Cumming, 2014), aby całkowicie zrezygnować z testów istotności na rzecz przedziałów ufności. Być może moglibyśmy wrzucić dużo i zacząć od nowa z czymś, co rzeczywiście ma sens? Może moglibyśmy spróbować uczyć czegoś, co ludzie mogą rzeczywiście zrozumieć?

Słyszałem o czymś co nazywa się statystykami Bayesa , moglibyśmy ich spróbować.

problemy klasyfikacyjne

Steiger z bar statistic – test istotności statystycznej dla różnic między korelacjami

meto

 

Nie wiesz, ale chcesz policzyć różnice pomiędzy korelacjami, policzyć efekt mediacyjny lub porównać różnice pomiędzy wektorami B?

Przeszukaliśmy dla Was internety w celu dostarczenia tego typu analiz statystycznych. Są one rzadko spotykane w oprogramowaniach statystycznych (np. tego typu analizy statystycznej w SPSS, Statistica, Gretl, SAS nie znajdziecie).
https://www.surrey.ac.uk/psychology/current/statistics/ChrisCalcv1_4.xls < – Steiger, J. H. (1980). Tests for comparing elements of a correlation matrix. Psychological Bulletin, 87, 245-251.

http://www.psychmike.com/dependent_correlations.php <- super ekstra akrusz kalkululacyjny z testami różnic między korelacjami, wskaźnikami B (analiza regresji), testem Aroiana i Sobela (analiza mediacji)

Firma statystyczna specjalista statystyk analiza danych

Związek między satysfakcją z pracy, motywacją, przywództwem, komunikacją i psychologicznym wzmocnieniem

meto

 

Związek między satysfakcją z pracy, motywacją, przywództwem, komunikacją i psychologicznym wzmocnieniem.

Egipscy badacze zweryfikowali związek między satysfakcją z pracy (job satisfaction), motywacją, przywództwem, komunikacją i psychologicznym wzmocnieniem (empowerment).

Badanie przeprowadzono na pracownikach dużej organizacji budowlanej w Egipcie rozdając 600 kwestionariuszy przypadkowo wybranym pracownikom. Z 600 kwestionariuszy powróciło 455 i na ich podstawie dokonano analiz statystycznych. Prawie trzy czwarte pracowników to mężczyźni, wiek pracowników wahał się od 30 do 50 roku życia a ich średnie doświadczenie zawodowe wynosiło ponad 5 lat.

Motywację wewnętrzną mierzono skalą stworzoną przez Olivera i Andersona (1994), motywację zewnętrzną mierzono skalą stworzoną przez Challagalla i Shervani (1996). Zmienną jaką była otwartośc komunikacji mierzono skalą stworzoną przez Kitchell (1995), a wsparcie przełożonych mierzono skalą stworzoną przez Netemeyer et al. (1997). Psychologiczne wzmocnienie było mierzone skalą stworzoną przez Spreitzera (1995). Każdy z wymiarów psychologicznego wzmocnienia – znaczenie, kompetencje, samostanowienie i wpływ (meaningfulness, competence, self – determination, impact) – mierzone były przez trzy itemy. Satysfakcja z pracy mierzona była skalą stworzoną przez Hartline i Ferrell (1996) oraz Sohi et al. (1996). Wszystkie itemy oceniane były na pięciostopniowej skali typu Likerta od zdecydowanie się nie zgadzam do zdecydowanie się zgadzam.

W celu weryfikacji związków pomiędzy zmiennymi przeprowadzono analizę korelacji.

Zmienne 1 1.1 1.2 1.3 1.4 2 2.1 2.2 3 4 5
1 Empowerment 1
1.1 Meaningfulness ,83** 1
1.2 Competence ,78** ,81** 1
1.3 Choice (Self – Determination) ,80** ,48** ,43* 1
1.4 Impact ,79** ,46** ,38** ,60** 1
2 Motivation ,41** ,26** ,33** ,34** ,37** 1
2.1 Intrinsic Motivation ,30** ,23** ,33** ,20** ,22** ,91** 1
2.2 Extrinsic Motivation ,40** ,19** ,15** ,43** ,44** ,64** ,25** 1
3 Communication ,80** ,99** ,74** ,46** ,45** ,25** ,23** ,16** 1
4 Leadership Support ,67** ,60** ,62** ,52** ,44** ,27** ,17** ,29** ,56** 1
5 Job satisfaction ,65** ,55** ,45** ,50** ,56** ,46** ,37** ,37** ,54** ,49** 1

**. Korelacje istotne na poziomie 0,01 (dwustronnie)

Z badań wynikają istotne konkluzje i implikacje dla managerów:

  1. Wydaje się, że zrozumienie procesów motywacji byłoby podstawową korzyścią dla pracodawców, którzy są zainteresowani zwiększeniem produktywności, wydajności i satysfakcji, a także zwiększenia umiejętności pracowników do mądrzejszego (smarter) myślenia i zachowania. Firmy powinny mieć możliwość identyfikacji pracowników motywowanych wewnętrznie, co pozwoliłoby na większe spersonalizowanie komunikatów w celu osiągnięcia pożądanych celów. W końcu pracownicy motywowani wewnętrznie dostosowują swoją wydajność bazując na otrzymywanej komunikacji (Fitcher, Cipola, 2010). Wysoki poziom kooperacji i pracy zespołowej wśród współpracowników i zarządu oznacza, że pracownicy są zadowoleni. Firmy powinny projektować odpowiednie nagrody i programy uznania pracowników w zależności od zachowania i preferencji pracowników. Konsekwentnie, wysoki poziom satysfakcji z wynagrodzenia i dodatkowych nagród mógłby zwiększyć motywację wewnętrzną. Niektórzy pracownicy są motywowani zarówno pożądaniem jak i osobistą dumą z wyższych wyników, gdy inni boją się o utratę pracy jeżeli nie będą osiągać wystarczająco wysokich wyników, co również działa jako czynnik motywujący.
  2. W kontekście Egipskim rola wsparcia przez przełożonego nie tylko motywuje pracowników, ale prowadzi również do poczucia inspiracji, wzmocnienia, zaangażowania (empowerment). Podkreślanie istotności satysfakcji z pracy informuje pracowników, że firma docenia ich lojalność i dobrostan. Wzmacnianie i inspirowanie (empowering) będzie rosło na znaczeniu ze względu na konkurencję. Tworzenie ulepszonego (enhanced) środowiska pracy, które wzmacnia, a także dodatkowe wsparcie przełożonych jest niezbędne żeby przyspieszyć inspirowanie i wzmacnianie (empowerment), komunikację i satysfakcję z pracy. Dodatkowo zwiększanie satysfakcji z pracy będzie prowadzić do zmniejszonej chęci odejścia z pracy, absencji, a także stresu związanego ze stanowiskiem pracy, oraz do zwiększonej produktywności i wydajności. Wewnętrznie motywowani pracownicy częściej radzą sobie z sytuacjami, które wymagają interpretacji niejednoznaczych wymagań, postrzegania ich jako wyzwanie i stymulacja ich obowiązków, co prowadzi do postrzegania swojej pracy jako bardziej interesującej. Kadra zarządzająca musi wziąć pod uwagę, że wykonywanie rutynowych czynności może być bardziej akceptowalne, gdy będzie powiązane z odpowiednimi nagrodami. Pracownicy mogą być zirytowani, jeżeli są karani za niewykonywanie rutynowych obowiązków, jako że ciężko poprawnie ocenić umiejętności, postawy i zdolności pracownika na podstawie rutynowych zadań. Pracownicy mogą postrzegać to samo zachowanie kadry zarządzającej jako wspierające lub niewspierające, mogą mieć inny kontakt z kadrą lub ta sama kadra zarządzająca może inaczej traktować różnych pracowników. Te ostatnie nazywane są diadą szef, przywódca (leader) – zwolennik, podążający (follower). Pracownicy martwią się karami związanymi z subiektywną oceną, konsekwentnie redukując swoją wydajność i satysfakcję z pracy.
  3. Pracownicy u przełożonego doceniają wsparcie, wzgląd, umiejętność jasnej komunikacji, umiejętność empatycznego słuchania, uczciwość i dostępność. Nawet jeśli wierzą w siebie, swój wkład i możliwości przywództwo może wzmocnić pewność siebie szczególnie u nowych i niedoświadczonych pracowników. Odwrotnie w sytuacji, gdy przełożeni nie zapewniają wsparcia, pracownicy będą czuli się sfrustrowani, zestresowani i bezsilni w odniesieniu do kontroli codziennych zadań. Mogą przypisywać wyniki na zewnętrzne zmienne takie jak związki osobiste ze współpracownikami, czy procedury organizacyjne.
  4. Przełożeni powinni pozwolić pracownikom wyrażać swoje opinie w konsktruktywnym dialogu, który powinien być otwarty, kreatywny i szanujący obie strony. Komunikacja może być zarówno formalna jak i nieformalna. Niektórzy przełożeni preferują narzucanie reguł co sposobu konwersacji, co może prowadzić do jednostronnej komunikacji, gdy oczekują wykonania pewnych obowiązków. Nawet jeśli tacy przełożeni chcą dwustronnej komunikacji, może być za późno, jeżeli nie ma wystarczającej przestrzeni dla pracowników, by mówić otwarcie, więc komunikacja jest dyrektywna i instruktywna. W konsekwencji limitowanie możliwości do kreatywnej i wzbogacającej komunikacji może być intencjonalne lub nieintencjonalne.
  5. Wyniki badań sugerują, że dostarczanie wysokiego stopnia interakcji społecznych poprzez przekonanie wszystkich pracowników w firmie do tego, że odgrywają rolę w dużym obrazie (big picture) dzięki działaniu jako zespół prowadziło nie tylko do zwiększenia elastyczności pod kątem wyższej produktywności, wydajności i satysfakcji z pracy, ale także większej transparentności w postaci informacji zwrotnej, okazji do awansu i dobrych relacji z innymi. Dialog jest opisywany jako instrument do tworzenia korzystnych warunków dla interakcji społecznych i uczenia się procesów oraz do zapewniania wsparcia i harmonii w relacjach pracowniczych i środowisku pracy. Dialog nie może być wymuszony i powinien być spontaniczny nawet jeśli tworzy konflikty. W końcu konflikty pokazują nam niewidzialne normy w miejscu pracy. Innymi słowy, nie chodzi o rozwiązanie nieporozumienia, tylko na pozwolenie na nie, dzięki czemu rozmówcy są wystawieni na swoje różne perspektywy.
  6. Informacja zwrotna dostarczona na czas od przełożonego dotycząca wydajnosci w pracy jest kluczowa. Na przykład, jeden pracownik pracował bardzo ciężko, wykonywał „dobrą robotę” i dostawał dużo wsparcia od współpracowników, jednak jego bezpośredni przełożony nie dostarczył żadnej informacji zwrotnej na czas. Gdy w końcu to zrobił, było już za późno i pracownik czuł, że otrzymanie uznania za wykonaną pracę trwało za długo. Takie słowa jak „dziękuję”, czy „dobra robota” byłyby dużo bardziej zachęcające w porównaniu do motywacji finansowej. Czasem managerowie boją się negatywnej informacji zwrotnej, ponieważ chcą uniknąć zakłopotania. Jednakże, kiedy negatywna informacja zwrotna jesdt potrzebna, przełożony musi przekazać to pracownikowi, zwiększając tym samym poczucie wyzwania i przywiązania u pracownika (Vakola, Bouradas, 2005; Srivastava, Rangarajan, 2008).

Strach może być dużym problemem w organizacji, ponieważ istotne informacje mogą nie być przekazywane ani wertykalnie ani horyzontalnie w organizacji. W konsekwencji organizacje mogą być zmuszone stawić czoła poważnym problemom. Co ironiczne, przełożeni czasem narzekali na brak aktywnej partycypacji u swoich podwładnych na zebraniach w pracy, nawet jeżeli wierzyli, że zachęcali pracowników do wyrażania opinii. Jednakże niektóre praktyki mogą przyczyniać się do klimatu ciszy w organizacji, takie jak centralizacja podejmowania decyzji i brak informacji zwrotnej. W konsewkencji pracownicy nie widzą sensu w rozmawianiu z nieodpowiedzialnym i nieprzejmującym się przełożonym lub organizacją, w końcu nikt nie chce być zaszufladkowany jako mąciciel (troublemaker)(Vakola, Bouradas, 2005). Przyczyną może być efekt pozycji władzy pzrełożonego. Grupa daje osobie posiadającej formalną władzę więcej miejsca do wypowiadania się. Związek władzy może być zdeterminowany nieformalnie, jako że warunki emocjonalne, pewność siebie i płynność werbalna uczestników również wpływa na te związki. Dodatkowo, jak wspomniano, ciężko jest przełożonemu być równie zainteresowanym i lubić wszystkich podwładnych, co oznacza, że nieszczera komunikacja od szefa może być grzeczniejszą alternatywą. Przełożeni mogą postrzegać tego typu zachowanie jako strategię zarządzania stresem, swoistą strategię wyjścia (Skagert et al., 2008). Może to być rozumiane jako kij z dwoma końcami – z jednej strony mają możliwość odejść z pracy kiedy tylko chcą, z drugiej strony dostępność osób, które wykonają ich pracę tak dobrze jak oni sami wytwarza bezpieczeństwo zatrudnienia.

  1. Inspiracja i wzmocnienie pracownika jest kluczowa w dzisiejszym kompetytywnym środowisku pracy, ponieważ może zapewnić firmie trwałą przewagę nad konkurencją. Badania wskazują, że inspirowanie i wzmacnianie pracowników jest wartościową opcją do zwiększenia ich satysfakcji z pracy. Ponadto, zapewnienie wysokiego poziomu inspiracji i wzmocnienia pracownika oznacza, że pracownicy posiadają wiedzę, umiejętności, postawy i zachowania, które mogą wytorować drogę nie tylko do bardziej kreatywnego, racjonalnego rozwiązywania problemów, ale także do wzbogacenia celów firmy. Zaprojektowanie miejsc pracy, które pozwolą na samostanowienie i posiadają znaczenie dla pracowników to ważne kroki w kierunku budowania satysfakcji z pracy, retencji i dobrostanu. Zarząd i przełożeni muszą okazać zainteresowanie oraz wsparcie, pozwolić pracownikom na zaangażowanie i uczestnictwo w procesach decyzyjnych, coachingu, informowaniu, interakcję z zespołem oraz muszą utrzymać jednocześnie dwustronną komunikację. Zaangażowanie pracowników w procesy decyzyjne może zwiększyć ich poczucie inspiracji i wzmocnienia poprzez pokazanie, że mają wpływ na procesy w organizacji. Informowanie i komunikowanie pracownikom zmian organizacyjnych i wpływ tych zmian na pracowników utrzymuje ich w połączeniu ze swoim miejscem pracy (satysfakcja z pracy). Role przełożonych mogą być istotne dla organizacji w bezpośrednim kształtowaniu doświadczeń w pracy, udogadnianiu zmian i postaw pracowników oraz wzmacnianiu satysfakcji z pracy. Na przykład, przełożeni mogą modelować preferowane zachowanie poprzez zwiększanie przejrzystości obowiązków i zmniejszając konflikt wynikający z niejasności stanowiska (Jones et al., 2001; Dewettinck Ameijde, 2011). Im bardziej zainspirowany i wzmocniony (empowered) czuje się pracownik, tym wydaje się lepiej rozumieć cele swojej pracy i to, jak wykonywać swoje obowiązki niezależnie od tego ile instrukcji dostał od managerów. Pracownicy którzy byli mniej zainspirowani i wzmocnieni mieli lepsze rozumienie tego, jak wykonywać swoje obowiązki wtedy, gdy ich managerowie przekazali więcej instrukcji. Zarząd powinien zachęcać do wzmacniania i inspirowania. Doprowadzi to do sytuacji, że w sytuacji nieobecności managera pracownicy będą czuli, że mogą swobodnie eksperymentować, podejmować ryzyko i popełniać błędy. Z czasem pracownicy będą w stanie pracować niezależnie. Usatysfakcjonowani pracownicy wkładają swoje serce i duszę w pracę, ale mogą niechętnie akceptować zwiększone obowiązki, ponieważ boją się zawstydzenia przez managerów lub tego, że zostaną wyśmiani przez kolegów. Mogą się opierać zmianom, ponieważ pozostawanie w status quo daje im poczucie bezpieczeństwa lub mogą odczuwać zwiększony dysonans i dwuznaczność w ich próbach zbalansowania wymagań stanowiska. Z punktu widzenia zarządu inspiracja i wzmocnienie pracowników może być postrzegane jako złe, jeżeli wiązałoby się ze zwiększonym kosztem, obsługą poniżej standardów lub błędnymi decyzjami po stronie pracowników. Może to prowadzić do obniżenia satysfakcji klientów. Pracodawca może zapłacić duzą cenę w sytuacji braku dopasowania kompetencji pracownika z wymaganiami pracy.

Te wnioski są wspierane przez pozytywny związek do komunikacji, który implikuje, że poczucie przynależności pracowników, komfort i przyjaźnie osiągają wysoki poziom. Pracownicy są usatysfakcjonowani z ich zaangażowania w mały obraz (small picture) jak i w duży, gdy otrzymują na czas istotne informacje jak tylko zarząd je otrzyma w celu osiągnięcia celów organizacji. Pracownicy są skłonni do osiągania pozytywnych wyników zwłaszcza kiedy te cele są zgodne z ich własnymi. W dodatku, partycypacja pracowników w ustalanie celów tworzyła poczucie akceptacji i wysoką motywację do osiągania tych celów. Wzmacniało to ich postrzeganie użyteczności drogi, którą muszą podążać żeby osiągnąć te cele. Jeżeli pracownik widzi konkretną ścieżkę, żeby osiągnąć konkretny cel i usunieto wszystkie kłody spod nóg, pracownik będzie celował w tę ścieżkę niezwłocznie (Akkirman, Harris, 2005; Goris, 2007; Carriere, Bourque, 2009).

Bibliografia:

Abd-El-Salam, E.M., Shawky, A.Y., El-Nahas, T., Nawar, Y.S., (2013). The Relationship among Job Satisfaction, Motivation, Leadership, Communication, and Psychological Empowerment: An Egyptian Case Study, SAM Advanced Management Journal, Spring 2013