Jak projektować badanie i analizować statystyki zebranych danych?

Metodolog - statystyczna analiza data minig

Metodolog.pl – Analiza Statystyczna w nauce

Firma statystyczna METODOLOG

Jak projektować ankiety i analizować statystyki z przeprowadzonego badania?

Błędne dane  mogą prowadzić nawet największych przywódców do niewłaściwych wniosków. Gdy sukces wisi na włosku, trzeba mieć pewność, że masz zgromadzone odpowiednie dane  odpowiednimi metodami.

Stworzyliśmy poradnik o tym, jak zabrać się za zbieranie i analizowanie danych. Jak projektować badania? Dowiesz się, jak napisać pytania, dystrybuować je i robić syntezy odpowiedzi.

Badania mogą mieć istotny wpływ na kierunek firmy, zwłaszcza jeśli masz wiarygodne wyniki.

Niezależnie od tego, czy wpływ ten jest dodatni czy ujemny zależy to od jakości badania. Projektowanie i analiza badania można dać światło na nowe możliwości; wadliwa konstrukcja pozostawia zespół w ciemności.

Widzieliśmy, jak dane mogą być wykorzystywane jako narzędzie, aby pomóc zespołowi w podejmowaniu trafnych wyborów. W tym rozdziale nauczymy Cię kilkunastu technik, które używamy aby zbudować skuteczne badanie za pierwszym razem.

Zanim zaczniemy

Ważne jest, aby pamiętać, że istnieje wiele kontrowersji wśród badaczy społecznych na temat projektu badania, ze sprzecznymi sugestiami na temat metod. Statystyki takie jak „margines błędu” są nadal szeroko stosowane, ale są rzadko spotykane w badaniach on-line. Starszy naukowiec danych Huffington Post i starszy redaktor wyborczy, na przykład, uważają je za „etyczną pomyłkę”. Konwencjonalna wiedza o tym, co się liczy, nie zawsze jest uziemiona w naukach statystycznych. Aby poradzić sobie z tym, niniejszy rozdział odnosi się do prostych wypróbowanych i prawdziwych metod. Mam nadzieję, że się przydadzą.

  1. Jak zaprojektować ankietę
  2. Najlepsze pytania badawcze i style odpowiedzi
  3. Jak napisać pytania i odpowiedzi w badaniu
  4. Jak wybrać respondentów
  5. Jak obliczyć liczbę respondentów, której potrzebujesz
  6. Jak analizować wyniki ankiety
  7. Jak interpretować wyniki ankiety
  1. Jak zaprojektować ankietę

Przed utworzeniem badania, ważne jest, aby myśleć o swoim celu. Wspólne cele obejmują:

  • Kompilacja badania rynku
  • Nakłanianie do feedbacku
  • Monitorowanie wydajności

Zanotuj specyficzną wiedzę, którą chcesz uzyskać z badania, wraz z kilkoma prostymi pytaniami, na które Twoim zdaniem może odpowiedzieć Twoja hipoteza (w tym zestaw możliwych odpowiedzi).

Obok odpowiedzi, zapisz odsetek odpowiedzi jakich można się spodziewać w każdym porównaniu wyników przyszłych, a  wobec tych domysłów ujawni się gdzie intuicja jest silna i gdzie istnieją ślepe domysły.

Takie wstępne badanie pomoże również syntetyzować ważne aspekty badania i poprowadzi Twój proces projektowania. Pamiętaj: Prostota jest prawdopodobnie najważniejszą i najbardziej funkcjonalną konstrukcja badania.

  1. Najlepsze pytania badawcze i style odpowiedzi

Sposób, w jaki struktura pytania i odpowiedzi będą określać granice analizy, które są dostępne dla Ciebie podsumowując rezultaty. Ograniczenia te mogą złamać lub mieć zdolność do zyskania wglądu do kluczowych pytań. Dlatego ważne jest, aby zastanowić się, jakie będzie podsumowanie odpowiedzi na pytania, jak można je zaprojektować.

Istnieją cztery główne pytania i style odpowiedzi, a więc cztery główne typy danych odpowiedzi:

  • Kategoryczne – nieuporządkowane etykiety, takie jak kolory lub nazwy handlowe; znana również jako „nominalna”
  • Porządkowe – Skala Likerta jak „zdecydowanie się nie zgadzam, zdecydowanie zgadzam się” lub „nigdy, często”
  • Interwałowe – Zakresy jak „liczba pracowników”
  • Wskaźnikowe – Numery takie jak cale

Aplikacje  do badań dostarczają szeroką gamę narzędzi gromadzenia danych, ale każdy typ danych spadnie do co najmniej jednego z tych czterech grup.

Dane kategoryczne

Kategorialny typ danych używa konkretnych nazw lub etykiet jako możliwego zestawu odpowiedzi. Na przykład:

Co lubisz (najbardziej / najmniej) o swoim produkcie?

  • Szybka obsługa klienta
  • Łatwość użycia
  • Jakość
  • Ilość

Kategoryczne dane są czasami określane jako „nominalne” dane, a to popularna droga dla pytań ankietowych. Kategoryczne dane to najprostszy rodzaj danych do analizy, bo jesteś ograniczony do obliczania udziału odpowiedzi w każdej kategorii. Zebrać, policzyć, podzielić i gotowe.

Jednak na dane kategoryczne nie można odpowiedzieć: „Ile?” pytania typu: „Ile cenisz szybkość obsługi klienta?”

Jeśli nie jesteś pewien, które wymiary są ważne (na przykład obsługa klienta, łatwość obsługi, itp), zacznij od kategorycznego zapytania – one są bardziej zwarte niż inne rodzaje pytań. Następnie, w badaniu można zapytać: „Ile?” Lepiej wysłać kilka rund poprawy badań niż doświadczyć ogromnego wybuchu, że brakuje zaznaczonych odpowiedzi.

Pobieranie próbek jest twoim przyjacielem. Rozważ podzielenie grupy próbek, aby można było wysłać wiele kolejnych badań, żeby dowiedzieć się więcej o swoich respondentach.

Dane porządkowe

Po zidentyfikowaniu kategorii, stawianie pytań w stylu porządkowym mogą pomóc ocenić, „Ile?”. Porządkowy typ reakcji przedstawia odpowiedzi, które mają sens jako zlecenie.

Never Rarely Sometimes Often Always
Strongly Disagree Disagree Neutral Agree Strongly Agree
Not important Somewhat important Neutral Important Very Important

Naukowcy z University of Michigan Institute for Social Research odkryli, że kolejność w jakiej odpowiedzi były odczytywane respondentom określa w jaki sposób odpowiedzieć.

Jeśli jest to możliwe, losowo odwrócić kolejność odpowiedzi porządkowych pytań dla każdego uczestnika. Pamiętaj, aby zachować kolejność spójną w całym badaniu, bo możesz pomylić respondentów i zbierać dane, które nie reprezentują swoich prawdziwych uczuć.

Alternatywnie, można osiągnąć ten sam efekt poprzez podział respondentów losowo na dwie grupy i administrowanie dwóch badań: jedno z kolejnością pytań płynących od strony lewej do prawej, a drugie od prawej do lewej.

Interwały danych

Dane muszą spełniać dwa wymogi, które można nazwać „odstęp”: muszą być uporządkowane, a odległość między wartościami musi być miarodajna.

Na przykład, z góry określony zestaw dochodów jak „$ 20k, 30k $, $ 40k” pasuje do przedziału modelu danych. Innym przykładem może być: „1-50 pracowników, 51-100 pracowników, 100-150 pracowników.”

Odstępy w danych są przydatne do gromadzenia danych segmentów (to znaczy, że jest przydatna do klasyfikowania innych kwestii). Na przykład, można zadać kolejne pytanie o plany respondenta, czy zamierza kupić dany produkt. Mógłbyś przyporządkować do segmentu to pytanie na podstawie ich odpowiedzi na poprzednie pytanie.

Jeśli to możliwe, to najlepiej używać równych wielkości interwałów. Pozwoli to na przejrzystość podsumowując wizualizacje wyników, a także na stosowanie średnich. Jeśli odstępy nie są równych wielkości, należy traktować te dane jako dane kategoryczne.

Dane na skali stosunkowej

Stosunek danych jest najbogatszym zbiorem danych ankietowych. Reprezentuje on dokładne pomiary. Kluczową cechą stosunku danych jest to, że zawiera pewną ilość, która może być określana jako „brak jakiejś ilości” -gdy wartość „0” lub „brak” jest tak samo ważną odpowiedzią jak „45” lub „987,123” lub inna wartość.

Oto przykład stosunku danych: Można zapytać respondentów o ich poziom dochodów z pola wprowadzania danych, które pozwala odpowiadać liczbami, jak $ 24315, $ 48.630 lub nawet 0 $.

Cechą charakterystyczną jest to, że stosunek danych jest możliwy do reprezentowania odpowiedzi jako ułamki, jak „$ 24.315 / $ 48,630 = 1/2”. Oznacza to, że zbiorcze dane statystyczne, takie jak średnie i odchylenia są ważne dla współczynnika przetwarzania danych i nie byłoby z danymi z wcześniej wymienionych rodzajów odpowiedzi.

Jeśli chcesz obliczyć średnie oraz miary zmienności jak odchylenie standardowe, prosząc o konkretną liczbę jako odpowiedź jest dobrym pomysłem.

  1. Najlepsze pytania badawcze i style odpowiedzi

Unikać wiodących pytań

Łatwo jest przypadkowo zasugerować pewną odpowiedź na swoje pytanie, podobnie jak sugestia psychologiczna: „Hej, wybierz tamto!”

Wyobraź sobie, że wypełniasz ankietę na stronie internetowej lokalnej gazety. Jest pytanie: „Wspierałbyś centrum gospodarki odpadów gdyby jego budowa obok placu publicznego była finansowana prywatnie czy publicznie?”

  1. finansowane ze środków prywatnych
  2. finansowane ze środków publicznych

Ale co, jeśli nie chcą budować centrum gospodarki odpadami obok placu? Zapach śmieci przez powietrze prawdopodobnie nie będzie zachęcać ludzi do odwiedzenia miasta. Badanie daje nam tylko dwie możliwości: zbudować go z prywatnych funduszy, lub zbudować go ze środków publicznych.

Bez opcji „wcale”, nie można powiedzieć się co każdy respondent naprawdę czuje. Pytanie w tym przykładzie przyjmuje założenie że pytany nie zgadza się. Określeniem na to jest „założenie”.

To perfekcyjnie pasuje do zadawania pytań typu: „Jak przydatny uważasz że jest produkt XYZ?”, tak długo, jak odpowiedź „wcale” jest dołączona jako opcja. Kluczową sprawą jest, aby uniknąć pewnego „założenia” w stosunku do odpowiedzi.

Założenia są artefaktem własnego kręgu kulturowego; prawdopodobnie nie zauważysz kiedy zawrzesz je w pytaniu. Najlepszym sposobem na uniknięcie tego jest, wysłanie ankiety do kilku osób w grupie docelowej, która uważasz, że nie zgadza się ze sobą w kwestii danego tematu. Nakłanianie zwrotne od zróżnicowanej publiczności może pomóc zweryfikować założenia i uniknąć tworzenia pętli sprzężenia zwrotnego w wynikach.

Pozwól na neutralne lub braki odpowiedzi

Trudno wpaść na wszystkie możliwe sposoby odpowiedzi jakie mogłaby wybrać dana osoba. Kiedy zmuszasz respondenta aby dał odpowiedź, może to zakrzywić Twoje dane. Na początku może się to wydawać niepożądane by pozwolić na to respondentom,

Unikaj złożonych pytań

Gdybym zapytał:

W skali 1-100  proszę ocenić następujący tekst:

– Metodolog i jego blog pomoże mi wykonać moją pracę.

Użytkownik będzie zmuszony dać odpowiedź odzwierciedlającą uczucia. To  może spowodować że respondenci będą wybierać przedmiot do którego mają najsilniejsze uczucia. Przypadki te mogą prowadzić do fałszywie interpretowanych wyników. Może być również możliwe, że respondenci mają przeciwstawne poglądy na temat obu przedmiotów. W takim przypadku na pewno zbierzesz mylące wyniki.

Podziel pytania na wiele pytań. Pamiętaj: pytania powinny być tak krótkie i bezpośrednie, jak to możliwe.

Używaj prostego języka

Spryt, humor i biznesowy żargon może zmylić respondentów, zwłaszcza jeśli powoduje to błędne rozumienie pytania które zadajesz. Celowo czy nie, mamy tendencję do pisania pytania używając naszych doświadczeń kulturowych jako wartości odniesienia, co może prowadzić do słabo sformułowanej kopii, które mogą zmylić ludzi. Używając prostego języka możesz zmniejszyć ryzyko, że dane które gromadzisz nie odzwierciedlają znaczenia respondenta.

Losowe odpowiedzi

Załóżmy, że chcesz zapytać, który z trzech produktów cenią użytkownicy najbardziej (po uwzględniając braki danych i „żadne”!). To wspólne dla respondentów, aby wybrać pierwszą odpowiedź, po prostu dlatego, że jest najprostsza i najbardziej dostępna. Randomizacja kategorii odpowiedzi może pomóc uniknąć stronniczości w odpowiedziach.

Uważaj jednak: jeśli pytanie dotyczy uporządkowanej odpowiedzi (na przykład: Zdecydowanie nie zgadzam się, zdecydowanie zgadzam się), należy zachować kolejność odpowiedzi w całym badaniu, aby uniknąć nieporozumień.

  1. Jak wybrać respondentów

Większość badań, przesyłanych jest do niewielkiej części większej populacji. Korzystanie z takich próbek do ogólnych stwierdzeń o ludności nazywa się wnioskowaniem. Statystykami opisowymi są wypowiedzi na temat tylko próbki; Wnioskowaniem statystycznym są wypowiedzi na temat populacji przy użyciu próbki.

Warto zauważyć, że wnioskowanie statystyczne z badań jest trudne, a często niemożliwe, nawet dla ekspertów. Czasami po prostu nie można uogólniać próbki na populację w sposób wiarygodny – zatrzymujesz się przygotowując sprawozdania na temat ludzi, którzy właściwie wypełnili ankietę.

Gdy próbka nie jest odbiciem społeczeństwa, którym jesteś zainteresowany. Unikanie stronniczości próbkowania jest szczególnie ważne, jeśli zamierzamy analizować wyniki w podziale na segmenty.

Jednym z najbardziej znanych przykładów tego problemu miał miejsce w wyborach prezydenckich w USA w 1948 roku.

Ankieterzy w trakcie tego okresu stosują techniki zwane próbkowaniem. Do badania zostało przypisanych kilak osób. Łatwiej badało się republikanów niż demokratów, według Arthur Aron, Elaine N. Aron i Elliot J. Coups w statystykach behawioralnych i Nauk Społecznych. To spowodowało, że większą część stanowili republikanie. System kwot faktycznie próbował uniknąć tego problemu jak stwierdził CBS News – poprzez podział badanych według płci, wieku i statusu społecznego, aczkolwiek przeoczył, to że segment (partia polityczna) był związany z trybem badania.

Przesłanie jest jasne: Jeśli respondenci nie pasują do populacji musisz złożyć oświadczenie o  tym, żeby twoje statystyki badania nie były mylące. Więc co można zrobić?

W przypadku wysłania ankiety pocztą elektroniczną, zastanowić się, jak badani przez e-mail mogą różnić się od populacji, o której chcesz złożyć oświadczenie.

Należy pamiętać, że respondenci, którym przesyłasz badanie e-mailem mogą nie być reprezentatywni dla tych, którzy wykorzystują Twoją stronę. Jest odwrotnie: jeśli umieścisz ankietę na swojej stronie internetowej, próbka może nie odzwierciedlać tych, którzy współpracują z organizacją za pomocą innych metod.

Aby temu przeciwdziałać, spróbuj wysyłać tę samą ankietę za pośrednictwem każdego z kanałów, które organizacja używa do interakcji z klientami (e-mail, strony internetowej, telefonicznie, osobiście, etc.).

Jeśli można użyć tylko jednego trybu, trzeba starannie rozważyć, czy ten tryb jest związany z segmentami, które chcesz analizować (np. czy są stałymi klientami bardziej skłonnymi do odpowiedzi?). Celem jest wykorzystanie trybu, który przyniesie rozmiary segmentów, które są reprezentatywne dla całej populacji. Może to oznaczać, że należy rozprowadzić ankietę za pośrednictwem różnych kanałów.

  1. Jak obliczyć liczbę respondentów jaka jest potrzebna?

Krótka odpowiedź brzmi: tyle, ile osiąga użyteczny poziom zmienności w odpowiedziach.  Jeśli zadajesz normalne, porządkowe lub interwałowe pytania, przeprowadź kilka badań bazowych i porównaj wyniki.

Jeśli zmienność od badania do badania jest wystarczająco niska dla celów badania, znalazłeś odpowiednią liczbę osób do przebadania. Jeśli twój cel wymaga mniejszej zmienności, zwiększ wielkość swojej próby w stosunku do populacji.

Inną techniką jest losowe podzielenie grupy próbek na kilka grup o jednakowych rozmiarach, administrowanie badania, analizy wyników, a następnie porównanie wyników całej grupy. Wyniki będą równoważne statystycznie, a różnica pomiędzy grupami będzie zależeć od tego co statystycy nazywają błędem próbkowania. Jeżeli różnice są mniejsze niż te, które byłyby wystarczająco ważne, aby zmienić wielkość grupy, jest ona wystarczająco duża dla przyszłych badań. Jednakże, jeżeli różnice pomiędzy grupami są duże, Twoim zdaniem, zwiększ wielkość swojej próby, powtórz te czynności, aż różnica między przypadkowymi grupami była mniejsza niż ta jaka mogłaby się przyczynić do prowadzenia dalszych działań.

Jeśli nie jesteś ekspertem w badaniach, wdrażanie dobrowolnej ankiety w sposób, który zapewnia prawidłowy pomiar margines błędu nie będzie możliwy, jedynym sposobem, dobrania wielkości próby jest zgadywanie i sprawdzanie.

Potrzebujesz więcej precyzji? Zwiększ wielkość próby.

  1. Jak analizować wyniki ankiety?

Łatwo jest zbudować ankietę i wysłać je do klientów, ale analizowanie wyników jest skomplikowaną częścią.

Jak już wcześniej wspomniano w sekcji projektowania badania, istnieją cztery główne sposoby, aby zebrać odpowiedzi na każde pytanie, a tym samym cztery główne typy danych, które można poddać konfrontacji podczas analizy wyników badania.

  • dane kategoryczne
  • dane porządkowe
  • Interwał danych
  • dane współczynnika

Dane kategoryczne

Obliczenie całkowitej liczby odpowiedzi, a następnie podzielenie liczby w każdej kategorii przez ogół. Są to tak zwane względne statystyki częstotliwości. Wiele po prostu nazywa je procentem udziałów, ale ważnym aspektem jest to, że suma powinna wynosić 100%. Na przykład:

CO NAJBARDZIEJ LUBISZ W NASZYM PRODUKCIE?

(Względna) Tabela częstotliwości

Answer Responses Share
Fast customer service 30 30 / 100 = 30%
Ease of use 40 40 / 100 = 40%
Quality 16 16 / 100 = 16%
Quantity 14 14 / 100 = 14%
Total 100 100%

Dane kategoryczne mogą być bardziej przydatne gdy pogrupujesz wyniki według segmentu klientów. Na przykład, możesz chcieć wiedzieć, czy nowi klienci odpowiedzieli inaczej niż długoletni klienci. Inne popularne kategorie to:

  • Segmenty produktów typu „low-end”, „średniego szczebla” i „high-end”
  • Segmenty geograficzne, takie jak kody pocztowe, powiat, kraj
  • Nowy klient kontra stały klient

Ważną rzeczą jest, aby dokładnie zastanowić się, które kategorie mają prawdopodobnie największe znaczenie dla organizacji. Najgorszą rzeczą, jaką możesz zrobić, to ślepo wybrać kategorie, które nie mają znaczenia dla firmy. Grupy wiekowe i zróżnicowanie ze względu na płeć są powszechną segmentacją rynku, ale co można rzeczywiście zrobić z tą informacją?

Po kategoryzacji grup, stwórz tabelę lub wykres do zapisania danych. Na przykład rozkład wyników w podzbiorach (zwany także tabulacją lub tabelą krzyżową) co jest macierzą liczby odpowiedzi lub udziałów z jednego segmentu skonstruowanego jako wiersze, a drugiego jako kolumny – to może być bardzo użyteczne.

TABELA KRZYŻOWA

Tabela podsumowuje fikcyjny zestaw 100 odpowiedzi. Po pierwsze, podzielono badania na dwie grupy, które znajdują się w 2 wierszach tabeli krzyżowej: tych, którzy byli nowymi klientami i tych, którzy byli stałymi klientami. Grupy wzajemnie się wykluczają (nie pokrywają) i wyczerpują (suma do 100%).

Następnie policzono liczbę odpowiedzi od odpowiedzi na pytanie: Co lubisz najbardziej w naszym produkcie? Wreszcie podzielono każdą liczbę w każdej komórce przez całkowitą liczbę odpowiedzi na to pytanie (uwzględniając obie grupy).

Tabele krzyżowe pokazują jak reakcje różnią się w poszczególnych kategoriach.  Ciekawe, że  w fikcyjnym zestawie danych jest to, że nowi klienci najbardziej lubią szybką obsługę klienta. Ponadto, klienci wybrali ustalone ilości i jakości najbardziej lubianych cech 2- i 4,5-krotnie częściej niż nowi klienci.

Dane porządkowe

Pytania porządkowe są bardzo popularne, ale wielu ludzi popełnia błąd krytyczny, jeśli chodzi o analizę danych. Najgorszą rzeczą, jaką możesz zrobić, to przekształcić odpowiedzi do liczb, a następnie obliczyć średnią z tych liczb. Powodem jest to, że średnia arytmetyczna (najczęstszy typ średniej, a jest ich wiele), jak (1 + 2 + 3 + 4 + 5) / 5 = 3 oznacza, że jest jakaś miara odległości między wartościami.

Jednak nie ma sensu mówić, że uczucie neutralne jest trzykrotnie mocniejsze niż uczucie silnego sporu, lub uczucie, że coś jest ważne, jest dwukrotnie większe niż poczucie, że coś jest dość ważne. Są to proste wskazówki, które w konwersji liczb porządkowych etykiet mogą powodować błędne wyniki.

Zamiast tego, najlepszą rzeczą do zrobienia jest stworzenie prostego wskaźnika mającego względną częstotliwość lub krzyżowje tabeli jak te powyżej dla danych kategorycznych.

Jak bardzo źle może to naprawdę iść? Cóż, kontrowersyjne pytanie, gdzie większość ludzi jest w silnym sporze lub silnym porozumieniu. W tym przypadku, średnia wskazuje, że dane są w środku kategorii neutralnej. To skrajny przykład, ale to samo może się zdarzyć, jeśli największe koszyki są powiedzmy, „neutralne” i „bardzo ważne”. Załóżmy, że odpowiedzi były podobne:

Średnia z 2,96 wydaje się sugerować, że respondenci mieli uczucia neutralne, podczas gdy w rzeczywistości większość poczuła że przedmiot był „dość ważny” (60%), a kolejna duża grupa (30%) uważa, że przedmiot badania był „bardzo ważny”. W związku z tym, nawet etykieta „neutralne” jest nie na miejscu.

Zamiast tego, pozostaw dane w postaci tabeli częstotliwości i pozwalać użytkownikowi końcowemu, aby zobaczył rozkład wyników bezpośrednio. Unikaj wpływania na interesariuszy pokazując średnią. Ludzie kochają średnie i skupiają się na nich, zamiast na prawdziwej historii. Celowo unikaj średniej i zamiast tego opisuj dane.

Większość respondentów stwierdziło że przedmiot badania był tylko nieco ważny, ale kolejna duża grupa poczuła że był bardzo ważne. Istnieją dwie główne grupy klientów tutaj, więc powinniśmy spróbować dowiedzieć się, jakie mogą być te segmenty. To może dać nam skoncentrowanie środków na tych, którzy czują że przedmiot jest ważny i pomoże uniknąć marnowania zasobów na tych, którzy czują że przedmiot jest tylko nieco ważny.

JAK NARYSOWAĆ ZWYKŁY WYKRES DANYCH

Rozbieżne wykresy słupkowe są doskonałym sposobem na wizualizację danych porządkowych. Elementem charakterystycznym jest linia, która pozwala na oko bardzo szybko zmierzyć długość każdego słupka. Te wykresy są idealne do porównań między segmentami.

Co roku (od 2010) Bank Rezerwy Federalnej w Nowym Jorku publikuje badania małych przedsiębiorstw (zgodnie z definicją firmy z mniej niż 500 pracowników) pokryte przez rezerwy Banków Cleveland, Atlancie, Nowym Jorku i Filadelfii. Głównym celem tego badania jest określenie, które małe firmy ubiegają się i odbierają kredyty.

Przez wykresy danych o wspólnym początku badania, porównanie strat, wychodzenie na czysto, a zysk jest wygenerowany jasno w całej kategorii.

W pierwszej połowie 2014 roku, czy Twoja firma osiągnęła  zysk, próg rentowności czy  straty?

Przedsiębiorstwa handlu detalicznego miały słabe wyniki w pierwszej połowie 2014. Wybrani kandydaci na kredyt byli Ci, którzy więcej zarabiali. Ponadto, im większa firma tym bardziej prawdopodobne że jest opłacalna.  Oznacza to, że w zakresie, w jakim firma jest opłacalna staje się ona duża. Może być tak, że mniejsze firmy są bardziej skłonne ponosić straty. Albo, może okazać się, że większe firmy amerykańskie szybciej podnoszą się z kryzysu finansowego, który rozpoczął się pod koniec 2007 roku.

Jeśli stwierdzisz że ten styl wykresu jest przydatny, stworzyłem szablon który można wykorzystać. Aby uzyskać więcej informacji na temat tego stylu graficznego, koniecznie zapoznaj się z Naomi B. Robbins i Richarda. artykuł M. Heiberger za „kreślenie Likerta i inne Skale Ocen”.

Interwał danych

Przydatnym i bezpieczny sposobem aby podsumować przedział danych są dane porządkowe.

Podsumowanie danych interwałowych ze średnimi i odchyleniami standardowymi (patrz rozdział „Stosunek danych” poniżej w przewodniku) jest możliwe, ale tylko wtedy, gdy odległość między przerwami jest parzysta. Dla przykładu, pytania typu „w skali od 1-10” z odpowiedziami 1, 2, …. 9, 10 są w równych odstępach czasu. Jednakże, istnieją pewne kontrowersje do tego.

Ludzie mają tendencję do unikania skrajności, więc może nie być dokładne powiedzenie, że przedział 5-6 jest 11 razy większy od 0-1. Pomyśl o pomiarze bólu, na przykład: jest to odległość od 5-6 taka sama jak między 0-1 lub 9-10? Zakładam że nie.

Moja sugestia jest taka, aby traktować dane porządkowe tak jak normalne dane, jeśli przerwy są równe, w innym przypadku traktować je jak dane nominalne i wykorzystać tabelę awaryjną dla podsumowania.

Poniżej znajduje się przykład sposobu, w jaki dane z nierównym interwałem mogą błędnie wskazywać dane. Ten przykład pochodzi bezpośrednio od kogoś kogo uważam za wielkiego wizualizera informacji: Stephen Few. Gorąco polecam stronę Stefana o wizualizacji, zwłaszcza w swoim artykule o wyborze odpowiedniego wykresu dla danych.

Można również skorzystać z bezpłatnego szablonu Google.

Współczynnik danych

Jest jeszcze jedna duża zaleta przy użyciu współczynnika danych: jest na tyle bogaty, aby wspierać średnie. Podobnie jak wcześniej, w naszym rozumieniu, kiedy mówię „średnio” Szczególnie odnoszę się do popularnego arytmetycznego znaczenia na przykład (1 + 2) / 2 = 1,5.

Jest to całkowicie poprawne wziąć zestaw współczynników danych  i obliczyć średnią arytmetyczną jak ($ 38500 + 65214 $) / 2 = $ 51,857.

Średnie dają Ci inspekcje, miary, na których dane są skupione. Są one także użyteczne do pomiaru rozprzestrzeniania się reakcji, w szczególności przy użyciu standardowego odchylenia. Intuicyjnie można traktować to jako średnią odległość od śrdniej. Obliczanie odchylenia standardowego wymaga procesu dwuetapowego.

  1. Obliczenie statystyki wariancji
  2. Wzięcie pierwiastka kwadratowego z wariancji statystyki
  3. Statystyka odchylenia jest określona jako: suma ([każda wartość – średnia^ 2) / N – 1

Na podstawie tych danych ankietowych, chcielibyśmy zapisać, „średnia liczba sesji udziałów wynosi 5 +/- 2,64 sesje”. Współczynnik danych ten jest szczególny, ponieważ pozwala on użyć miar tendencji centralnej (średnia) oraz dyspersji (odchylenie standardowe) w odróżnieniu od nominalnej, porządkowej, a nie samych danych przedziałowych.

  1. Jak interpretować wyniki ankiety

Wizualizacja danych jest jednym z najważniejszych działań. Jest to moja pasja, ponieważ wykresy mogą wywoływać różnorodne reakcje emocjonalne. Ludzie mają bardzo różne reakcje na dane oparte na tym jak jest to przedstawiona na wykresie, dlatego tak ważne jest, aby być rozsądnym podczas tworzenia wizualizacji.

Po pierwsze trzeba skupić się na trendach i uniknąć zbyt dużej ilości małych różnic w danych. Patrząc na statystyki i wykresy ważne jest, aby pamiętać, że istnieje jakiś błąd w każdej metodzie.

Przy interpretacji wyników, należy rozpocząć od największych różnic. Jeśli zauważysz niezwykły wynik, bądź sceptyczny i sprawdź, czy wynik może być powielony w innym badaniu.

Zbierz Kilka linii bazowych ankiet przed podjęciem dużej zmiany.

Jeśli jest to praktyczne, spróbuj powtórzyć i podsumować ankiety kilka razy przed podjęciem dużej zmiany produktu lub firmy. Zorientuj się, co jest normalne, a ile odpowiedzi odchyla się od badania z badania. Jest to możliwe, aby wpaść w pułapkę błędu próbkowania i efektu, który nie jest powtarzalny. Replikacja (powtarzane badania) jest najlepszym sposobem, aby dowiedzieć się, co sygnał reprezentuje.

Po powtórzeniu tego samego badania, może się okazać, że odpowiedzi różnią się znacznie w tej samej kwestii, chociaż nie została dokonana wielka zmiana (patrz rozdział zatytułowany „Jak wielu ludzi mam badać?”). W tym przypadku, dowiesz się, że pytanie nie jest wiarygodną metryką definiowania sukcesu. Albo, możesz mieć szczęście i okaże się, że reakcje są na ogół podobne przed dokonaniem dużej zmiany.

Po dokonaniu zmian, będziesz miał lepszy pomysł, czy zmiany w odpowiedzi na pytanie ankietowe są wynikiem decyzji, czy też nie. Chodzi o to, aby dowiedzieć się trochę o tym, jak użytkownicy reagują na badania przed użyciem go do podejmowania dużych decyzji.

Szanuj limit precyzji swojego badania.

Ważne jest, aby zrozumieć, limity dokładności dla każdego zbioru danych. Ponieważ większość badań stanowi jedynie niewielką część grupy interesów, przy podejmowaniu wnioskowanie na populacji występuje błąd. Jeżeli pomiar rzeczywiście następuje poprzez przesyłane badania kilku grupom w tym samym czasie, wynik względnej częstotliwości (w procentach) nie może się różnić o więcej niż 1%. Oznacza to, że numery takie jak 25.67% będą komunikować fałszywy stopień precyzji.

Przedstawiając swoje wyniki badań, okrągłe numerom jak 25%, aby uniknąć przekazywania fałszywego stopnia precyzji ile należy zaokrąglić? Zależy to od zmienności próbkowania ankiety (patrz rozdział zatytułowany „Ile osób powinienem badać?”).

Tabela lub wykres?

Tabele są najbardziej użyteczne, gdy patrzysz na dokładne liczby, lub gdy istnieje kilka porównań. Duże tabele sprawiają, że trudno zrozumieć temat dystrybucji wyników, i w tych przypadkach wizualizacje są bardziej korzystne.

Wniosek

Sondaże są bardzo skutecznym narzędziem do zbierania informacji zwrotnych od klientów i zmniejszenia niepewności wokół podejmowania ważnych decyzji. Pisząc o celu ankiety i hipotez, będzie można dowiedzieć się, gdzie intuicja jest silna i znaleźć organizacyjne martwe pole.

Badania są ciężkie i uprzedzenia mogą pojawić się przez słabą próbę ankietowych i słabą konstrukcję pytań. Ważne jest, aby myśleć o tym, jaki rodzaj danych będzie najbardziej przydatny, aby odpowiedzieć na pytania, na wyciągnięcie ręki. Najbardziej jest prawdopodobne ze skoncentrowane badania przyniosą zaskarżone wyniki.

 Proces polega na znalezieniu właściwych pytań, tak samo jak na znalezieniu właściwych odpowiedzi.

Gdy czujesz się pewnie ze swoim projektem, możesz wysłać jedno duże badanie końcowe. Należy pamiętać, że najlepiej zaprojektowane badanie na świecie jest bezużyteczne, jeśli jego wyniki nie są skutecznie przekazane zainteresowanym stronom. Nie zakrzywiaj danych kategorycznych lub porządkowych poprzez średnie, tylko podsumowuj je przez względne częstotliwości. Nie bombarduj czytelników wynikami które są niemożliwe do strawienia. Stwórz rozbieżny wykres słupkowy. W przypadku korzystania z danych przedziałowych pamiętaj o przydatności segmentacji i nie oszukuj czytelników poprzez wizualizację nierównych odstępów czasu.

Wreszcie, badania nie są miejscem, aby uzyskać wyniki fantazyjne. Spraw żeby były proste, a przekonasz się, że bez względu na wyniki nauczysz się czegoś użytecznego.

Zrobiłeś to. Nauczyłeś się różnicy między formularzami, ankietami i sondażami, odkryłeś najlepsze aplikacje formularzy i ankiet, dowiedziałeś się, jak zintegrować formularze do swojej pracy, a teraz masz narzędzia potrzebne do analizy danych. Ale jest coś więcej. Czasem trzeba nieco więcej mocy niż tylko standardowe badania. Może chcesz w łatwy sposób analizować dane bezpośrednio z bazy danych, lub chcesz zbudować formy na narzędzia w domu, które będą działać razem z pozostałymi danymi.

Na to i wiele więcej, istnieją aplikacje opierające się na bazach danych. W przypadku niektórych aplikacji bonusowych, które pomogą Ci zrobić jeszcze więcej z formularzy i ankiet, znajdziesz najlepsze aplikacje do budowania własnych narzędzi w domu bez większej ilości pracy, której niż większość aplikacji wymaga.