Dobór obserwacji/uczestników do badania

Dobór losowy jest najlepszym z wszystkich wymienionych sposobów doboru osób badanych do próby i wszędzie tam, gdzie to możliwe, powinniśmy go stosować.

Jak podkreśla Jerzy Greń (1987), losowość próby nie tylko sprzyja otrzymywaniu prób reprezentatywnych (a więc takich, w których rozkład badanej cechy nieistotnie różni się od rozkładu populacji), ale również umożliwia wykorzystanie rachunku prawdopodobieństwa do wnioskowania o populacji.

Aby poprawnie przeprowadzić losowanie z populacji do próby, potrzebny jest mechanizm losowy oraz operat losowania. Mechanizm losowy powinien umożliwić jednoznaczną odpowiedź na pytanie, czy dany element ma zostać umieszczony w próbie, czy też nie. Bardzo wygodnym i równocześnie prostym w użyciu mechanizmem losowym są zamieszczone w wielu podręcznikach statystycznych tablice liczb losowych. Operat losowania to z kolei ponumerowany spis wszystkich elementów populacji. Może to być na przykład lista wszystkich uczniów szkół podstawowych na terenie jednego miasta, lista pracowników wszystkich oddziałów jednego z banków działających w danym województwie lub lista wszystkich abonentów telekomunikacji na terenie całego kraju. Jednostką losowania nie musi być pojedyncza osoba. Może nią być na przykład szkoła podstawowa czy też jeden oddział banku. Dlatego operat losowania może przybrać formę ponumerowanego spisu wszystkich szkół podstawowych z danego miasta (a nie uczniów tych szkół) albo wszystkich oddziałów danego banku, działających na terenie województwa (a nie pracowników tego banku).

W większości podręczników statystycznych omawia się pięć podstawowych schematów losowania:

(1) Losowanie nieograniczone indywidualne (simple random sampling), które stosuje się wtedy, gdy populacja jest niezbyt duża i homogeniczna. Ponieważ przy tym sposobie doboru do próby losujemy pojedyncze elementy (na przykład osoby) z całej, niepo-dzielonej na części populacji, konieczny jest rzetelny operat losowania. Jako mechanizm losowania mogą tu posłużyć tablice liczb losowych.
(2) Losowanie systematyczne indywidualne (systematic sampling) tym rożni się od losowania, że nie wymaga użycia tablic liczb losowych. Nadal jednak potrzebujemy bardzo dokładnego operatu losowania, a populacja, z której będziemy wybierali próbę, powinna być niezbyt duża i homogeniczna. Schemat ten nazywany jest też często schematem losowania co k-ty element, ponieważ posługiwanie się tą techniką polega po prostu na wybieraniu z listy tych elementów populacji, których numery różnią się liczbą całkowitą nazywaną odstępem losowania (k).

(3) Losowanie warstwowe (stratified sampling) efektywne jest wtedy, gdy populacja jest bardzo zróżnicowana pod względem interesującej nas zmiennej. Jeżeli na przykład będziemy interesowali się poziomem wypalenia zawodowego w populacji nauczycieli, to losowanie nieograniczone indywidualne może doprowadzić do tego, że pewne wartości interesujących nas zmiennych będą w próbie reprezentowane zbyt licznie, inne zaś niedostatecznie. Możemy po prostu wylosować zbyt wielu nauczycieli z krótkim stażem pracy, zbyt mało z dużym lub odwrotnie. Losowanie warstwowe, w odróżnieniu od dwóch wcześniej opisanych wariantów losowania, wymaga wstępnego podzielenia populacji. Dzielimy ją na tak zwane warstwy (strata). Powinny one zostać utworzone, tak, by osoby wchodzące w skład różnych warstw różniły się pomiędzy sobą wartością cechy ważnej z punktu widzenia doboru do próby (stażem pracy), a osoby zaliczone do tej samej warstwy różniły się tą cechą jak najmniej (podobny staż pracy). Inaczej mówiąc, warstwy cechuje homogeniczność. Po podzieleniu populacji na warstwy, sporządzamy dla każdej z nich oddzielny operat losowania, a następnie, posługując się tablicami liczb losowych, z każdej niezależnie wybieramy osoby, które włączymy do próby. Najczęściej tworzymy proporcjonalne próby warstwowe (proportionate stratified samples), co oznacza, że liczebność poszczególnych warstw powinna być proporcjonalna do liczebności homogenicznych grup tworzących populację^Na przykład, jeżeli populacja osób chorych na chorobę NN obejmuje 80% mężczyzn i 20% kobiet, to także na poziomie próby ta relacja płci powinna być odzwierciedlona jeżeli liczba osób znajdujących się w próbie wynosi 1000, to powinno w niej być 800 mężczyzn i 200 kobiet

(4) Losowanie grupowe (cluster sampling) stosujemy wtedy, gdy populacja jest bardzo liczna i gdy nie dysponujemy operatem losowania. Ta technika, tak jak losowanie warstwowe, również wymaga podzielenia populacji. Tym razem jednak robimy to inaczej. Tworzymy grupy, które powinny być jak najbardziej zróżnicowane wewnętrznie pod względem interesującej nas cechy. Osoby wchodzące w skład tej samej grupy powinny więc jak najbardziej się od siebie różnić, a różne grupy powinny być do siebie podobne.

Jeżeli jako grupę potraktujemy nauczycieli zatrudnionych w jednej szkole, to będą oni niewątpliwie zróżnicowani pod względem stażu pracy. Równocześnie ta grupa będzie podobnie zróżnicowana, jak grupa nauczycieli zatrudnionych w innej szkole. Operatem losowania w wypadku tego schematu losowania będzie spis ponumerowanych grup. Za pomocą tablic liczb losowych będziemy losować do próby nie pojedyncze elementy populacji (poszczególnych nauczycieli), ale całe grupy (wszystkich nauczycieli zatrudnionych w wylosowanej szkole).

(5) Losowanie wielostopniowe (multistage sampling) jest kombinacją wcześniej omówionych schematów losowania. Najpierw dzielimy populację na (wewnętrznie niezróżnicowane) warstwy (na przykład wszystkie szkoły podstawowe w województwie wielkopolskim dzielimy na szkoły znajdujące się w dużym mieście, w małym mieście i na wsi). Następnie z każdej warstwy losujemy niezależnie pewną liczbę (wewnętrznie zróżnicowanych) grup (na przykład losujemy po dwie szkoły z każdego z tych trzech środowisk). Na koniec zaś z każdej grupy (szkoły), w ramach każdej warstwy (szkoły na wsi, w małym mieście i w dużym mieście)^ oddzielnie losujemy pewną liczbę elementów (uczniowie).

Greń (1987) wyróżnia cztery podstawowe podziały

opisanych tu schematów losowania próby. Są to:

(1) Losowanie niezależne versus losowanie zależne. Losowanie zależne (bezzwrotne) polega na tym, że raz wylosowany element populacji nie jest do niej zwracany i w związku z tym przy losowaniu każdego kolejnego elementu liczebność populacji zmniejsza się o 1. Stosowane jest ono najczęściej wtedy, gdy wybieramy próbę z populacji skończonej. Losowanie niezależne polega z kolei na tym, że każdy wybrany z populacji element jest do niej zwracany, dlatego też prawdopodobieństwo wylosowania każdego z nich jest takie samo. Tę technikę wykorzystujemy do populacji nieskończonych.

(2) Losowanie indywidualne versus losowanie zespołowe. Pierwszy z tych wariantów odnosi się do losowania z takich populacji, które składają się z pojedynczych, niepogrupowanych elementów (na przykład uczniów, lekarzy czy osób cierpiących na schizofrenię). Drugi z kolei wymaga utworzenia grup (na przykład nauczyciele pracujący w jednej szkole, mieszkańcy tego samego osiedla).

(3) Losowanie jednostopniowe versus losowanie wielostopniowe. Za pomocą losowania jednostopniowego tworzymy próbę, wybierając do niej elementy bezpośrednio z populacji. Losowanie wielostopniowe składa się z kilku etapów (najpierw losujemy do badań szkołę, potem klasę, następnie zaś konkretnych uczniów).

(4) Losowanie nieograniczone versus losowanie ograniczone. Losowanie nieograniczone polega na losowaniu bezpośrednio z całej populacji. Jest to więc losowanie jednostopniowe. Ograniczone losowanie z kolei polega na tym, że próba tworzona jest poprzez oddzielne losowania tylko z części, na które wcześniej została podzielona populacja.

Dobór nielosowy

Powtórzmy raz jeszcze, że jeśli każdy element populacji ma taką samą szansę na pojawienie się w próbie, to o takiej próbie mówimy, iż jest losowa. Dobór losowy jest najlepszym sposobem tworzenia próby, bo sprzyja uzyskiwaniu prób reprezentatywnych i umożliwia wnioskowanie o populacji na podstawie rachunku prawdopodobieństwa. Musimy jednak pamiętać o tym, że sam fakt zastosowania techniki losowego doboru nie gwarantuje, że próba będzie dla populacji reprezentatywna.

Nie zawsze losowanie osób badanych do próby jest możliwe. Są takie sytuacje, w których z konieczności musimy stosować dobór celowy. Wtedy badacz sam – albo odwołując się do opinii eksperta – wybiera określone osoby do grupy. Jeżeli na przykład psycholog analizuje efekty długotrwałej terapii osób z padaczką pourazową, która ma na celu między innymi zmniejszenie częstości napadów epileptycznych, to w tej sytuacji trudno o losowanie uczestników takiego badania z populacji. Grupy badane przez psychologów klinicznych są zazwyczaj niewielkie, a ich struktura często nieadekwatnie odzwierciedla strukturę populacji osób dotkniętych tym samym zaburzeniem. Dlatego też przy interpretacji wyników uzyskanych dla takich prób trzeba być bardzo ostrożnym w formułowaniu wniosków, które miałyby uzyskane rezultaty uogólniać na populację lub na inne grupy osób.

Czasami jednak badaczom udaje się wykazać, że próba dobrana do badań w sposób celowy nie różni się pod względem pewnej liczby ważnych cech od populacji. W takiej sytuacji większość jest skłonna uznać próbę za reprezentatywną i traktować ją tak, jakby to była próba losowa. Takiego porównania badacze mogą dokonać oczywiście tylko wtedy, gdy dysponują dokładnymi informacjami na temat struktury tejże populacji.

Próba złożona z ochotników.

W badaniach psychologicznych, a zwłaszcza w eksperymentach, zazwyczaj uczestniczą ochotnicy (volunteer subjects). Grupa ochotników nie jest ani próbą losową, ani próbą dobraną celowo. Po prostu każda osoba, która zgłasza chęć wzięcia udziału w badaniach, zostaje do niej włączona. Nawet wtedy, gdy rozkład zmiennych uznanych za ważne z punktu widzenia badań i w populacji, i w tak skompletowanej próbie byłby podobny, grupa złożona z ochotników tylko pozornie byłaby reprezentatywna dla populacji, na którą chcielibyśmy uogólniać wyniki. W rzeczywistości jest ona w pewnym stopniu tendencyjna. Ochotnicy różnią się od pozostałych osób przede wszystkim tym, że wyrazili chęć uczestniczenia w badaniach, które nie były
obowiązkc>#& Ochotnicy różnią się od nieochotników również pod innymi względanńt-i dlatego uzyskane przez nich wyniki będą nietypowe dla populacji jako całości. Zasięg wniosków z badań przeprowadzonych? na takich osobach będzie ograniczony do pewnego fragmentu populacji. Dlatego też próba złożona z ochotników jest stronnicza, a trafność zewnętrzna rezultatów badawczych uzyskanych na podstawie wyników tej próby stoi pod wielkim znakiem zapytania.

Robert Rosenthal i Ralph Rosnow (1975,1984; Rosnow i Rośenthal, 1976) przeprowadzili badania i sporządzili „portret psychologiczny” osoby zgłaszającej się na ochotnika do udziału w badaniach psychologicznych. Ów portret obejmuje 17 podzielonych na trzy grupy cech różniących ochotnika od nieochotnika. Pierwsza grupa obejmuje 5 cech najbardziej dominujących i najlepiej udokumentowanych. Są to: (1) wyższy poziom wykształcenia, (2) przynależność do wyższej klasy społeczno-ekonomicznej; wyższy status społeczny, (3) wyższy poziom inteligencji, (4) wyższy poziom aprobaty społecznej oraz (5) większe zsocjalizowanie. Następna grupa obejmuje 6 kolejnych, średnio udokumentowanych cech. Są to: (6) zwiększona tendencja do poszukiwania stymulacji; widoczne jest to zwłaszcza w chęci uczestniczenia w badaniach nad stresem, deprywacją sensoryczną czy hipnozą, (7) zwiększona tendencja do zachowań niekonwencjonalnych (na przykład w sferze zachowań seksualnych), (8) ochotnikami częściej są kobiety, ale w wypadku badań nad stresem są to raczej mężczyźni, (9) niższy poziom autorytaryzmu, (10) ochotnikami są raczej wyznawcy religii żydowskiej niż protestanckiej i raczej protestanckiej aniżeli katolickiej (uwaga: badania dotyczyły populacji amerykańskiej), (11) niższy poziom konformizmu, ale w wypadku kobiet biorących udział w badaniach o profilu klinicznym jest odwrotnie. Ostatnia grupa obejmuje 6 najmniej udokumentowanych  cech. Są to: (12) ochotnicy pochodzą z mniejszych miast (zwłaszcza gdy są to badania o charakterze kwestionariuszowym), (13) zwiększone zainteresowanie religią (też raczej w badaniach kwestionariuszowych), (14) większy poziom altruizmu, (15) ochotnicy są bardziej otwarci, (16) w badaniach nad lekami, hipnozą czy – ogólnie – w badaniach typu medycznego ochotnicy wykazują niższy poziom przystosowania, (17) ochotnicy są młodsi, chyba że badania mają charakter laboratoryjny i biorą w nich udział kobiety.

Czy jest zatem szansa na uzyskanie trafnych rezultatów badawczych wtedy, gdy posłużymy się grupą złożoną z ochotników? Może w niektórych sytuacjach tak, ale zastanówmy się, co mogłoby się stać, gdybyśmy na przykład normalizowali test inteligencji, posługując się wynikami próby złożonej z ochotników. Ponieważ – jak wynika z przytoczonego „portretu psychologicznego” – są oni bardziej inteligentni i mają wyższe wykształcenie od nieochotników, ostateczna wersja testu składałaby się prawdopodobnie z pozycji, które dla całej populacji mogłyby się okazać zbyt trudne. Wyższy poziom aprobaty społecznej u ochotników mógłby spowodować, że wyniki uznawane za normę w skalach kłamstwa stosowanych w różnych kwestionariuszach osobowości byłyby dla populacji jako całości zawyżone. Wyższy status społeczny ochotników nie sprzyjałby trafnej ocenie standardu życia całej populacji. Jeżeli do tego dołączymy powszechnie znane z psychologii społecznej przykłady błędnych wniosków wyprowadzanych na podstawie eksperymentów, w których brali udział ochotnicy (na przykład badania Le-ary’ego i Alberta nad wpływem LSD na osobowość przestępcy [por. Jankowski, 1972] albo analizy Kinseya i jego współpracowników [1948,1953] dotyczące wzorców zachowań seksualnych mężczyzn i kobiet), musi nas to doprowadzić do wniosku, że należy bardzo ostrożnie podchodzić do wyników badań przeprowadzonych na próbie skompletowanej z osób, które odpowiedziały na nasze ogłoszenie opublikowane w gazecie czy wywieszone na tablicy.