Randomizacja obserwacji/i/badanych

Grupy eksperymentalne w jednym eksperymencie nie powinny różnić się między sobą w sposób systematyczny przed podjęciem działań eksperymentalnych. Jeżeli są one wstępnie równoważne, to wszelkie zaobserwowane systematyczne różnice muszą zostać przypisane różnicom wynikającym z podjętych działań eksperymentalnych. Często stosowanym sposobem na utworzenie wstępnie równoważnych grup jest dobór losowy, czyli randomizacja.

Dobór losowy osób badanych do poszczególnych rodzajów warunków eksperymentalnych znaczy w szczególności, że każda osoba badana ma jednakowe prawdopodobieństwo trafienia na każdy rodzaj warunków eksperymentalnych, niezależnie od jakichkolwiek jej cech a priori. Procedura taka skutecznie wyrównuje wszelkie wpływy uboczne. Rozważmy raz jeszcze eksperyment porównujący trzy metody nauczania języka francuskiego. Jeżeli dokonamy doboru losowego osób badanych do trzech grup, to iloraz inteligencji, który może korelować z wynikami w nauce francuskiego, nie będzie wykazywać systematycznej zmienności między grupami (patrz trafność wewnętrzna eksperymentu). Dobór losowy wyrównuje również wpływ wszelkich pozostałych zmiennych ubocznych we wszystkich rodzajach warunków eksperymentalnych. Ponieważ w takim wypadku różnice między rodzajami warunków eksperymentalnych są jedynymi systematycznymi różnicami w eksperymencie, powinny one być przyczyną wszelkich istotnych różnic zaobserwowanych w wyniku jego przeprowadzenia. Można wówczas określić zależności przyczynowo-skutkowe. Randomizacja odgrywa szczególnie doniosłą rolę w planach eksperymentalnych z grupami niezależnymi oraz w planach z blokami zrandomizowanymi, w których osoby badane przyporządkowywane są losowo do każdego rodzaju warunków eksperymentalnych w obrębie poszczególnych bloków.

Jak wspomniano wyżej, randomizacja wiąże się z dokonywaniem przyporządkowania osób badanych do dowolnego rodzaju warunków eksperymentalnych z jednakowym prawdopodobieństwem. Termin randomizacja nie oznacza zatem żadnego subiektywnego wrażenia ani przypadkowego układu, lecz jasno sprecyzowane procedury operacyjne. Procedury te mogą się wiązać z rzucaniem monetą, wyciąganiem ponumerowanych kart z dobrze potasowanej talii bądź z posłużeniem się tablicami liczb losowych. Tablice takie składają się z ciągów cyfr od 0 do 9. Każda cyfra pojawia się tam w przybliżeniu z jednakową częstością, a sąsiadujące cyfry są od siebie niezależne. Tablice liczb losowych można znaleźć między innymi w  książce Fishera i Yatesa (1963), a także w wielu innych publikacjach. Dla przykładu przypuśćmy, że chcemy dobrać grupę eksperymentalną liczącą 12 osób badanych z próby 40 osób. Wszystkim osobom nadajemy numery od 1 do 40. Następnie w tablicy liczb losowych bierzemy dowolny wiersz, kolumnę bądź przekątną i wybieramy pierwsze kolejne 12 różnych liczb między 1 a 40**. W wyniku tego postępowania otrzymujemy zbiór 12 osób badanych. Możemy też, oczywiście, zastosować inne procedury.

W przypadku planów z powtarzanymi pomiarami poszczególne rodzaje warunków eksperymentalnych stosuje się w jednej grupie osób badanych, na których dokonuje się wszystkich pomiarów. Oczywiście w takich planach nie stosuje się randomizacji. Plany te opierają się na zasadzie doboru, dzięki której tworzy się grupy równoważne. Pojawiają się tu jednak szczególne problemy wynikające z dokonywania pomiarów na tych samych osobach badanych. Mogą mianowicie wystąpić efekty przenoszenia sprawiające, że osoba badana nie jest dokładnie tą samą osobą przed i po przeprowadzeniu oddziaływań eksperymentalnych. W celu zrównoważenia ewentualnych efektów przenoszenia konieczna może się okazać randomizacja kolejności stosowania różnych rodzajów warunków eksperymentalnych u poszczególnych osób. Procedura ta jest niezbędna do uzyskania dobrych analiz statytsycznych

Losowanie wielostopniowe

Losowanie wielostopniowe (Multi-stage sampling)

Losowanie dwustopniowe bardzo łatwo uogólnić na losowanie wielostopniowe, w którym najpierw losujemy jednostki pierwszego stopnia, z nich losujemy jednostki drugiego stopnia itd. aż do losowania elementów badania statystycznego, np. ludzi. Schemat losowania wielostopniowego znajduje zastosowanie np. w badaniach pedagogicznych, w których próbuje się porównywać skuteczność różnych metod nauczania. Jeśli takie badanie miałoby dotyczyć całego obszaru Polski, to możemy sobie wyobrazić, że jednostkami losowania pierwszego stopnia byłyby województwa, drugiego stopnia – szkoły, trzeciego stopnia – klasy w szkołach, a jednostkami czwartego stopnia byliby uczniowie. Można sobie także wyobrazić, że kończymy losowanie na jednostkach trzeciego stopnia, tj. klasach, i do próby włączamy wszystkich uczniów wylosowanych klas.

Losowanie dwustopniowe

Losowanie dwustopniowe CSimple two-stage cłuster sampling; two-stage sampling)

Losowanie dwustopniowe można traktować jako rozwinięcie zasad losowania grupowego. W tym schemacie losowania nie włączamy do próby wszystkich elementów, jakie znajdują się w wylosowanych grupach, ale z każdej z nich, również w sposób losowy, drogą losowania nieograniczonego indywidualnego (losowania prostego bez zwracania) pobieramy tylko część elementów. W tego typu schemacie losowania grupy nazywane są jednostkami losowania pierwszego stopnia, natomiast elementy losowane w wybranych już grupach to jednostki losowania drugiego stopnia.

Zespołowe losowanie nieograniczone (losowanie grupowe) [Cluster sampling)

W tym schemacie pobierania próby losuje się nie poszczególne, pojedyncze elementy zbiorowości statystycznej, jak w dotychczas rozważanych schematach ale ich zespoły (grupy). Do próby wchodzą wówczas wszystkie elementy tworzące wybrane grupy.

Sposób tworzenia grup jest w zasadzie dowolny. Mogą to być klasy w szkole, szkoły w mieście, bloki mieszkalne, oddziały szpitalne, strony tekstu w książce itp. Pamiętać jednak musimy, że do próby wchodzą wszystkie elementy tworzące wylosowane grupy. Przy tego typu losowaniu musimy także zwracać uwagę, aby losowane grupy nie były zbyt liczne, gdyż w takim przypadku cała próba robi się bardzo liczna i możemy mieć problem z przebadaniem każdej jednostki, która znalazła się w próbie.

Indywidualne losowanie warstwowe (Stratified random sampling)

Ten schemat losowania nazywany bywa po prostu losowaniem warstwowym. Losowanie takie, zamiast losowania prostego, powinniśmy przeprowadzać wówczas, gdy badana populacja dzieli się na pewne podpopulacje mocno zróżnicowane pod względem badanej cechy. Przeprowadzenie w takim przypadku losowania prostego może doprowadzić do znaczącego zniekształcenia uzyskanych rezultatów.

Podział na warstwy przeprowadzany jest na podstawie pewnego kryterium, które z jednej strony zapewnia podział badanej populacji na warstwy rozłączne (ten sam element nie może należeć do dwóch różnych warstw), z drugiej strony uzyskane warstwy powinny różnić się pod względem rozkładu badanej cechy. Kryterium takim może być kryterium geograficzne, co jest niekiedy wymagane w badaniach genetycznych, może to być rodzaj szkoły, wielkość miejscowości, w której mieszkają respondenci, poziom narażenia na czynniki szkodliwe itp. Po podziale na warstwy losowanie wewnątrz każdej warstwy może być losowaniem prostym, systematycznym lub innym (np. losowaniem prostym z różnymi prawdopodobieństwami wyboru, którego tutaj nie rozważaliśmy).