ceny usług analiz obliczeń statystycznych

Wywiad badawczy w projekcie analitycznym Konrad Hryniewicz

Metodolog.pl – Analiza Statystyczna w nauce

Firma statystyczna METODOLOG

Wywiad badawczy w projekcie analitycznym Konrad Hryniewicz

Sekcja A. Opis problemu badawczego.

  1. Psychologia ekonomiczna.
  2. Wpływ cech osobowości na zachowania finansowe.
  3. Charakter projektu jest weryfikacyjny. Chodzi w nim o to aby poddać weryfikacji zmienne dotyczące cech osobowości na różnorodne zachowania finansowe ludzi.
  4. Projekt ma konkretne hipotezy i nic w nim nie trzeba eksplorować.
  5. Nie
  6. Poproszę o pełny opis w standardzie APA oraz wizualizację w formie wykresów (ale nie tabel)
  7. Konrad Hryniewicz (Sopot – Trójmiasto) 798 30 95 31.
  8. Jestem właścicielem firmy usługowej.

Sekcja B. Metodologia

  1. Przedmiotem badania byli ludzie.
  2. W badaniu wzięło udział 1000 osób.
  3. Nie, choć chodzi o analizy również w podgrupach.
  4. Cechy osobowości mierzono raz, ale zachowania finansowe mierzono w odstępie dwóch lat.
  5. Badano jedną grupę osób, ale dokonano powtórnego pomiaru zachowań finansowych
  6. Weryfikowano wpływ cech osobowości modelu BIG5 i ocenienano jakie mają oddziaływanie na zachowania finansowe.
  7. Nie korelowano ze sobą niczego.
  8. Dane o cechach osobwości zebrano skrócona wersją kwestionariusza 5 Cech Osobowości BIG5 Costy&Mcrea, informacje o zachowaniach finansowych zebrano autorską ankietą. Dodatkowo zebrano informacje o cechach demograficznych osób badanych za pomocą serii pytań metryczkowych.

Sekcja C) Hipotezy.

  1. W badaniu stawiam 2 problemy badawcze.
  2. Hipoteza nr 1 – Cechy osobowości u osób młodszych wpływają na zachowania finansowe silniej niż u osób starszych. Hipoteza nr 2 – Zachowania finansowe są niezmienne w czasie.

Sekcja D) Zmienne weryfikujące hipotezy/przewidywania/problemy badawcze.

Hipoteza nr 1. Cechy osobowości u osób młodszych wpływają na zachowania finansowe silniej niż u osób starszych.

  1. Aby uzyskać zmienne dotyczące cech osobowości trzeba utworzyć wskaźniki:

Ekstrawersja zmienne w bazie – EKS1, EKS2, EKS3

Sumienność zmienne w bazie – SUM1, SUM2, SUM3,

Naurotyczność zmienne w bazie – NEU1, NEU2, NEU3

Ugodowość zmienne w bazie – UG1, UG2, UG3

Otwartość na doświadczenia – OTW1, OTW2, OTW3

  1. Aby uzyskać zminne dotyczące zachowań finansowych trzeba odkryć/wyeksplorować spośród zmiennych w bazie od zach_f1_pomiar1, do zach_f50_pomiar1 pomiary odnoszące się do określonych zachowań finansowych np. tendencje zakupowe w sklepie, wydawanie pieniędzy na przyjemności itp.
  2. Osoby badane trzeba podzielić na młodsze i starsze według zmiennej wiek_w_latach.

Hipoteza nr 2 – Zachowania finansowe są niezmienne w czasie.

Trzeba dokonać porównania zmiennych zach_f,  w czasie pomiaru pierwszego i drugiego.

Sekcja E) Uwagi końcowe.

Poproszę o informowanie mnie ilości czynników/typów na które się dzielą zachowania finansowe. Muszę podjąć decyzję o ich ilości w oparciu o teorię. Poza tym chciałbym porozmawiać o metodach statystycznych wykrywania tych czynników.

Wywiad badawczy w projekcie analitycznym.

meto

Metodolog.pl – Analiza Statystyczna w nauce

Firma statystyczna METODOLOG

Wywiad badawczy w projekcie analitycznym.


 

W celu usprawnienia pracy personelowi analitycznemu Metodolog i usystematyzowania wiedzy i działań Tobie, przeprowadzamy swego rodzaju wywiad. Założeniem tego wywiadu jest pomoc w przetłumaczeniu problemów badawczych  na język analitycznych rozwiązań. Dzięki tej metodologii pracy będziemy mogli lepiej zrozumieć specyfikę Twojego projektu i problematykę z którą musimy się zapoznać by była ona dobrze przez nas zrozumiana (od tego zależy sukces projektu). Naszym celem jest spełnienie Twoich oczekiwań w kontekście odkrycia prawdy naukowej lub biznesowej, a co za tym idzie? Doskonałe wykonanie analizy statystycznej Twojego projektu.

Najlepiej będzie jeśli zapoznasz się z poniższymi cennymi, a zarazem krótkimi podpunktami. Twoja odpowiedź na nie pomoże nam zorientować się w problematyce Twojego projektu oraz pozwoli na realizację rzetelnej pomocy. Przygotuj nam plik tekstowy odpowiadający na poniższe pytania (przykład jak to wygląda).

*podświetlone na czerwono przekierowują na stronę z bardziej rozbudowanymi wyjaśnieniami.


a) Opis problemu badawczego lub biznesowego.

W tym kontekście potrzebujemy ogólnego zarysu podejmowanej przez ciebie problematyki. Musimy wiedzieć z jakim uniwersum mamy do czynienia.

W tym podpunkcie musimy znać odpowiedź na następujące pytania.

  1. W jakiej dziedzinie nauki lub biznesu jest osadzony Twój projekt badawczo analityczny?
  2. Jaki jest problem badawczy?
  3. Czy projekt ma charakter weryfikacyjny, a jeśli tak to jakie są w stosunku do niego przewidywania?
  4. Czy projekt ma charakter eksploracyjny, a jeśli tak to co chciałbyś/ałabyś uzyskać?
  5. Czy projekt ma polegać na wykonaniu samych obliczeń?
  6. Czy projekt ma polegać na wykonaniu obliczeń i opisania toku analiz wraz z wizualizacją w eleganckim raporcie statystycznym?
  7. Imię klienta, miejsce zamieszkania (miasto) i nr kontaktowy.
  8. Jesteś uczniem/studentem/doktorantem/naukowcem/pracownikiem/właścicielem firmy/urzędnikiem?

 

b) Metodologia

Pokrótce opisz o tym co zostało wykonane by zebrać dane. Jak wyglądała metodologia badania, czyli?

  1. Co było przedmiotem badania?
  2. Ile osób brało udział w badaniu?
  3. Badanie polegało na porównywaniu grup obiektów?
  4. Było to badanie polegające na kilkukrotnym pomiarze tych samych obiektów?
  5. Czy porównywano różne grupy obiektów i dokonywano na nich kilkukrotnych pomiarów?
  6. Był to eksperyment?
  7. Czy było to badanie korelacyjne?
  8. Jakimi narzędziami zebrano dane ? Była to ankieta, kwestionariusz psychologiczny, linijka, waga, stoper, specjalistyczne urządzenie medyczne, zdjęcia, oceny w dzienniku szkolnym, informacje pozostawione przez klienta na stronie internetowej?

 

c) Hipotezy

W tym miejscu musisz przedstawić szczegółowo lub ogólnie hipotezy/przewidywania/problem badawczy do statystycznej weryfikacji.

  1. Ile jest hipotez/przewidywań/problemów?
  2. Jak one brzmią?

 

d) Zmienne weryfikujące hipotezy/przewidywania/problemy badawcze.

To miejsce jest szczególnie ważne. Musimy wiedzieć, które zmienne w bazie danych weryfikują Twoje hipotezy/przewidywania/problemy badawcze. Jest to istotne z tego względu, że jeśli mamy odpowiedzieć na oczekiwania to musimy wiedzieć jakie zmienne w bazie są informacjami, które biorą udział w weryfikacji hipotez/przewidywań/problemów badawczych. Mogą być tutaj różne sytuacje, które wpływają na wykonanie różnych kroków związanych z analizą. Są nimi pewne kwestie związane z istnieniem zmiennych, czyli:

  1. Czy zmienne w bazie można bezpośrednio użyć do weryfikacji?
  2. Zmienne istnieją w bazie, ale czy trzeba ułożyć z nich wskaźniki?
  3. Zmienne istnieją w bazie, ale czy trzeba odkryć/eksplorować to które będą brane pod uwagę?

W tym podpunkcie ważne jest zapisanie szczegółowych hipotez/przewidywań/problemów badawczych i powiązanie ich ze zmiennymi biorącymi udział w ich weryfikacji lub zmiennymi, które potencjalnie będą utworzone na zasadzie wskaźników lub wykrycia w toku analiz odkrywania/eksploracji.


Przykładowy zapisy hipotez/przewidywań/problemów badawczych.

Hipoteza nr 1. Płeć oraz wiek wpływa istotnie na wagę osób.

Zmienne: płeć, wiek_w_latach, waga_w_kg (zmienne w bazie do bezpośredniego użycia)


Hipoteza nr 2. Samoocena wpływa na zadowolenie z życia.

Zmienne: Samoocenę tworzy suma zmiennych (Pyt_SO1,, Pyt_SO2, Pyt_SO3) w arkuszu 1, Zadowolenie z życia tworzy uśredniony wynik zmiennych (H_1, H_2, H_3, H_4) w arkuszu 2 (zmienne wskaźnikowe)


 Hipoteza 3. Osoby z różnymi cechami demograficznymi mają odmienne preferencje reklam w TV.

Zmienna zróżnicowanie cech demograficznych jest odkrywana na podstawie analizy skupień, która klasyfikuje obserwacji do różnych grup na podstawie zmiennych (wiek, wykształcenie, stan cywilny) np. młode, bez wykształcenia wyższego, single Vs starsze, z wykształceniem wyższym, rodzice z dziećmi (zmienne poddane eksploracji)

Typy preferencji reklam zmienne – reklama_emocjonalna, reklama_content_marketing, reklama_dla_dzieci (zmienne w bazie do bezpośredniego użycia)


e) Uwagi dodatkowe.

Tutaj można wpisać swoje uwagi dodatkowe dotyczące ważnych kwestii projektu lub pytania.

(przykład jak to wygląda) <- zobacz jak wygląda przykład takiego wywiadu.

Może być tak, że będziesz potrzebować szczególnej pomocy ze względu na niestandardowy lub bardziej skomplikowany projekt. W takim wypadku oferujemy kompleksową i poszerzoną pomoc.


meto

statystyka medyczna, biostatystyka

Analiza danych w medycynie – czyli jaką rolę odgrywa Big Data w badaniach nad Parkinsonem.

Analiza danych w medycynie – czyli jaką rolę odgrywa Big Data

Analiza danych w medycynie – czyli jaką rolę odgrywa Big Data w badaniach nad Parkinsonem.

W ostatnich latach, coraz większą popularnością cieszą się urządzenia monitorujące nasze zdrowie. Smartwatche i smartbandy zyskują kolejnych użytkowników, którzy wykorzystują je w celu zbierania informacji na temat stanu swojego zdrowia. Przy ich pomocy możemy zebrać dane np. na temat snu, bądź jeżeli uprawiamy sport, to małe urządzenie na nadgarstku pomoże usystematyzować dane o osiągnięciach i dostarczyć nowych cennych informacji.


Nie trzeba było długo czekać, by znaleźć poważniejsze zastosowanie dla tych technologii. Intel we współpracy z Fundacją Michaela J. Foxa, podjął się badań nad chorobą Parkinsona przy pomocy urządzeń typu „wearables”. Odzież technologiczna jest w stanie dyskretnie zbierać i przekazywać obiektywne dane empiryczne w czasie rzeczywistym, 24 godziny na dobę, siedem dni w tygodniu. Jest to duży postęp w diagnozowaniu i leczeniu Parkinsona. Dzięki zastosowaniu sensorów badacze pozyskają ogrom danych do analizy Big Daty. Nie trudno się domyślić, że w porównaniu z dotychczas stosowanymi metodami monitorowania przebiegu choroby u pacjenta, przeskok w ilości danych będzie ogromny. Jednakże dopiero taka masa danych dostarczy badaczom materiał, na podstawie którego będą w stanie zgłębić istotę problemu choroby Parkinsona i wykryć wzorce. Big Data odgrywa w tym kluczową rolę.


Ze względu na obszerność danych Intel opracował platformę analityczną do big data, która wykorzystuje różne rodzaje oprogramowania, w tym Cloudera CDH — platformę open source, która gromadzi i przechowuje dane oraz nimi zarządza.  Platforma big data obsługuje aplikację analityczną do przetwarzania oraz wykrywania zmian w danych w czasie rzeczywistym. Poprzez wykrywanie anomalii i zmiany w czujniku, może dostarczyć naukowcom obiektywną metodę pomiaru progresji choroby. Zaawansowane możliwości analizy danych udostępnione przez Big data Intel z pewnością okażą się pomocne w dalszych badaniach nad chorobą.


analizy statystyczne pomoc statystyczna metodolog

Projektowanie eksperymentów dla początkujących (case study z reklamą banerową). Metodologia badań w biznesie.

            Kiedy odwiedzasz supermarket, możesz czuć przytłoczenie promocjami i darmowymi gadżetami, które dostajesz wraz ze swoim zakupem. Czy kiedykolwiek sobie wyobrażałeś, jak firmy decydują o tym, czy będziesz bardziej podniecony promocją czy, może darmowym prezentem ?

Jak oni mogą o Tobie tak dużo wiedzieć i być tak blisko Twoich uczuć w ogóle Cię nie znając ?

Jak  możliwości analityki i badań  rozwijają dalszą ewolucję firm ? Menadżerowie działów marketingu, oczekują od działów analityki dostarczenia wglądu w liczne pytania takie jak ” Czy nasi klienci bardziej kochają upominki od zniżek ? Czy nasi klienci odpowiadają na reklamy, które zawierają obraz ikony sportu ?

Oczywiście menadżerowie Ci zadają więcej różnych i dziwnych pytań, ale jeśli chodzi o pieniądze to prawda jest taka, że różnica pomiędzy mądrym, głupim i dziwnym pytaniem się zaciera

Od analityków danych wymaga się zagłębienia głęboko w dane w celu znalezienia tych odpowiedzi używając do tego dostepnych narzędzi i technik. Ale co jeśli nie mamy danych ? Jeśli firma nigdy nie wykorzystywała popularnej osobowości do reklamy lub jeśli nie oferowała darmowego prezentu to wtedy jak dane mają nam pomóc odpowiedzieć na to pytanie ?

Sytuacja w której istotne dane pozostają niedostępne jest dość powszechna w naszych czasach. Kiedy potykamy się z taką sytuacją, często wspomagamy się oceną eksperta lub próbujemy zidentyfikować odpowiednie pełnomocnictwa lub pytamy klientów. Gdy robimy tą ostatnią rzecz to dostajemy odpowiednie dane wymagane do odpowiedzi na nasze pytania. Proces pytania klientów wymaga wykonania eksperymentów lub testów. W tym właśnie procesie możemy uzyskać wynik lub odpowiedź na interesujące nas pytania.

Koncepcja testowania ( A/B, Split – Run, Plip – Flop oraz Test vs Control).

A/B, Split – Run, Plip – Flop oraz Test vs Control są powszechnymi metodologiami, które są wykorzystywane do zrozumienia pływu pojedyńczych czynników na zachowanie klientów.

Metodologia Split – Run Testing

W celu przetestowania efektywności marketingowej komunikacji (  głównie w drukowanych reklamach), można użyć testowania Split – Run lub testowania Flip – Flop. Testowanie split jest zdecydowanie najskuteczniejszym sposobem testowania drukowanych reklam. Do prowadzenia badań metodą Split wykorzstuje się dwie różne wersje tej samej reklamy, każda oczywiście z innym numerem identyfikacyjnym. Są one umieszczane do publikacji losowo tego samego dnia.  To zapewnia, że dokładnie połowa publikacji będzie ujawniała jedną wersję reklamy, a druga połwa drugą wesję reklamy. Sposób w jaki reklamy są umieszczane zapewnia, że próbki są absolutnie losowe pod każdym względem.  Podobna koncepcja może być uzywana do testowania stron internetowych, banerów oraz również jakichkolwiek funkcjonalności webowych.

Metodologie Flip Flop Testing.

W przypadku kiedy testowane uniwersum zmiennych nie gwarantuje giętkości prowadzenia kampani Split – Run, ale istnieją osobne publikacje reklam dla różnych regionów, można użyć różnych rekam dla różnych regionów. Najwększym problemem tej metody jest to, że próbki nie są losowe. A co za tym idzie ? Nie wykluczone, że inne czynniki niż region mogą wpływać na wyniki pomiarów.

Test vs. Control

Grupa kontrolna jest zdefiniowana jako grupa klientów, którzy są identyczni jak klienci normalni których jednak kwalifikuje się do kampanii  lub innej zamierzonej akcji marketingowej. Badani z grupy kontrolnej nie są poddawani jakiejkolwiek akcji. Niemniej jednak zachowanie klientów z grupy kontrolnej jest porównywane z zachowaniem klientów którzy są poddawani działaniu akcji makretingowej. Takie porównanie zapewnia dobre zrozumienie wpływu działania gospodarczego.

Problemy z tradycyjnym testowaniem.

Metodologie badawcze wymienione powyżej dostarczają solidne odpowiedzi dla wpływu pojedyńczego czynnika interwencji marketingowej za jednym razem. Co dzieje się jednak kiedy, czynników, które oddziałują jednocześnie jest zbyt wiele ? W takim przypadku, trzeba przeprowadzić dużą liczbę badań w celu ustalenia wpływu każdego czynnika. Jak wiemy, czytanie i wprowadzanie wyników testów  zajmuje dużo czasu i pieniędzy. Tak więc, wskazane jest aby sprawdzić wpływ wielu czynników oraz  zrobić wszystko by zapewnić sobie odpowiednie wnioski, że generuje się z badania niezbędną wiedzę w dostępnym budżecie. Co można zrobić inaczej ? Przekonajmy się na przykładzie.

Koncepcja metodologii projektowania eksperymentów.

Marketerzy często potrzebują testowania wpływu szerokiego zakresu targetowania, reklamy, promocji, wycen  i opcji produktów, aby znaleźć optymalną kombinację czynników by otrzymać pożądane wyniki przy najmniejszym możliwym budżecie.

Ponieważ budżet marketingu jest zawsze ograniczony, dlatego niemożliwe staje się przetestowanie wszystkich kombinacji każdego marketingowego parametru. Dlatego marketerzy często budują i testują ramy teoretyczne, które pomagają im w identyfikacji kilku krytycznych zmiennych dla których warto przeznaczyć budżet. W wielu przypadkach ( w sumie w większości dobrych badań marketingowych), koncepcja projektowania eksperymentów jest szeroko używana w budowaniu i testowaniu pewnych przewidywań teoretycznych. Projektowanie eksperymentów jest powszechną anlityczną techniką implementowaną do budowania dobrych ram teoretycznych.  Aby zilustrować  użycie projektowania eksperymentów, zacznijmy od internetowego banneru.

Istnieje wiele czynników, które wpływają na sukces reklamy typu baner. Ważne jest określenie (zoperacjonalizowanie) sukcesu metrycznego dla baneru rekamowego. Najbardziej powszechnym sukcesem metrycznym, którego się używa jest Clik Through Rate. Click through rate jest bardzo łatwym miernikiem, który jest wyliczany jako: Liczba odwiedzających użytkowaników którzy kliknęli w link reklamy podzielony przez liczbę użytkowników, którym wyświetliła się reklama.

Sukces baneru reklamowego zależy od wielu czynników np. takich jak: strona internetowa, treść reklamy, miejsce wyświetlania reklamy ( najważniejszy czynnik), umieszczenie reklamy. Z dostępną kombinacją zmiennych, koncepcja projektowania eksperymentów może być bardzo skutecznie aplikowana i mierzona w tym scenariszu.

Póki co, dość teori ! Myślę, że trzeba zrozumieć tę koncepcję w praktyce już teraz ! Dla uproszczenia, mam na uwadzę reklamę która składa się z następujących cech:

– obrazek

– wiadomość tekstowa na temat oferty i produktu

– przekierowujący link ( który przekierowuje na stronę reklamodawcy ) Jest to miejsce zwane „Call to Action Link”

Przykład ten zawiera w sobie następujące parmetry.

– pozycja obrazka ( lewa, prawa, środek)

– pozycja „Call to Action Link” ( na górze, pod spodem)

– obecność animacji i ruchu w obrazie (tak, nie)

– pozycja baneru reklamowego na stronie internetowej ( lewa, prawa)

Paremetry (wymienone powyżej) są także nazywane czynnikami. Wartość tego parametru lub czynika często nazywa się się poziomem lub atrybutem. Dla przykładu ” Pozycja obrazka) jest parametrem lub czynnikiem, a watości jakie przyjmuje to „Lewo „, „Prawo” oraz „Środek” które są poziomami lub atrybutami. Narysunku nr 1 przedstawiono przykładową kombinację czynników na stronie internetowej.

Rysunek nr 1.

W celu upewnienia się co do skuteczności wszystkich tych elementów, ważne jest aby przeprowadzić eksperymet gdzie odwiedzający stronę są wystawieni na wszystkie możliwe kombinacje czynników pokazanych powyżej przy jednoczesnym pomiarze wskaźnika CTR.  Tabela nr 1 przedstawia całkowite możliwe kombinacje.

Tabela nr 1.

Kombinacja Pozycja obrazka Pozycja „call to action link” Występowanie enimacji Pozycja na stornie internetowej
Lewa Prawa Środek Góra Dół Tak Nie Lewa Prawa
4 1 0 0 1 0 0 1 0 1
8 1 0 0 0 1 0 1 0 1
12 0 1 0 1 0 0 1 0 1
16 0 1 0 0 1 0 1 0 1
20 0 0 1 1 0 0 1 0 1
24 0 0 1 0 1 0 1 0 1
2 1 0 0 1 0 1 0 0 1
6 1 0 0 0 1 1 0 0 1
10 0 1 0 1 0 1 0 0 1
14 0 1 0 0 1 1 0 0 1
18 0 0 1 1 0 1 0 0 1
22 0 0 1 0 1 1 0 0 1
3 1 0 0 1 0 0 1 1 0
7 1 0 0 0 1 0 1 1 0
11 0 1 0 1 0 0 1 1 0
15 0 1 0 0 1 0 1 1 0
19 0 0 1 1 0 0 1 1 0
23 0 0 1 0 1 0 1 1 0
1 1 0 0 1 0 1 0 1 0
5 1 0 0 0 1 1 0 1 0
9 0 1 0 1 0 1 0 1 0
13 0 1 0 0 1 1 0 1 0
17 0 0 1 1 0 1 0 1 0
21 0 0 1 0 1 1 0 1 0

Można zaobserwowa, że są 3 możliwe pozycje zdjęcia, 2 możliwe pozycje guzika „Call to action link”, 2 konfiguracje działania animacji ( obecność lub brak) oraz 2 możliwych umiejscowień na stronie internetowej (lewa, prawa). W związku z tym będzie 3*2*2*2 = 24 kombinacji które można otrzymać w takim układzie eksperymentu. Jest to duża ilość możliwych kombinacji do indywidualnego zbadania.

Marketerzy używali koncepcji projektowania eksperymentów aby ograniczyć liczbę kombinacji ( spośród wszystkich mozliwych kombinacji) które muszą być sprawdzone aby wyciągnąś sensowne wnioski i zaplanować odpowiednie działania. W celu zrozumienia jak projektowanie eksperymentów może pomóc w ograniczeniu liczby combinacji, które muszą być testowane, trzeba zrozumieć działanie każdego atrybutu lub poziomu osobno jak i efekt tych atrybutów działajacych w interakcji.

Projektowanie eksperymentów bez efektów interakcyjnych.

Poziomy określonego parametru lub czynnika są stosowane jako zmienne do konstruowania funkcji odpowiedzi dla każdej kombinacji wymienionych w tabeli 1. Np. czynniki ” Pozycja obrazka” składa się z 3 poziomów . Dlatego też, ze względu na ilość stopni  swobody, trzeba utworzyć dla tej zmiennej dwie zmienne binarne. Każde dwa poziomy mogą być uznawane za zmienne binarne. I przypadku pozycji „lewo” i „prawo”  można użyć zmiennych binarnych w takich przypadkach. Jeśli obrazek jest w miejscu „lewa” to binarna zmienna przyjmuje wartość 1, jeśli inną to 0. Jeśli obrazek jest po prawej stronie to binarna zmienna przyjmuje wartości 1 w innym przypadku 0. Jeśli pozycja obrazka jest na śtodku strony to zmienne „lewa” i „prawa” przyjmują wartości 0. Podobnie można użyć jednej zmiennej w każdym przypadku innych parametrów ( Ponieważ reszta parametrów składa się z 2 poziomów czynnika). Jeśli nie zakładamy efektu interakcji pomiędzy czynnikami to funkcja odpowiedzi może być zapisana jako:

Ln(CTR/(1-CTR))=a + β(obrazek po lewej) + β2(obrazek po prawek) + β3 (guzik call to action na górze) + β4 ( animacja:tak) + β5 (pozycja na stronie po lewej)

W tym wzorze „CTR” oznacza prawdopodobieńśtwo odpowiedzi lubklikalności.   β reprezentuje wpływ każdego atrybutu lub poziomu na prawdopodobieństwo odpowiedzi.

Na podstawie poprzednich doświadczeń odkryto, że w większości przypadków, reakcje mogą być przewidywane przy użyciu funkcji logistycznej.  Generyczna funkcja odpowiedz wymagana jest przy każdej kombinacji projektownia. Przykładowy zapis kombinacji przedstawiono  w tabeli 2.

Tabela nr 2. Równanie dotyczące reagowania dla pierwszych dwóch kombinacji.

Kombinacja

Pozycja obrazka Pozycja „call to action link” Występowanie enimacji Pozycja na stornie internetowej Równanie dotyczące reagowania.
Lewa Prawa Środek Góra Dół Tak Nie Lewa Prawa

4

1 0 0 1 0 0 1 0 1

Ln(CTR/(1-CTR))=a+B1+B3

8 1 0 0 0 1 0 1 0 1

Ln(CTR/(1-CTR))=a+B1

Projektowanie eksperymentów z efektami interakcji.

Idąc dalej można powiedzieć, że połączenie animacji i umieszczenia reklamy po prawej stronie strony internetowej  może być bardziej efektywne w  połączeniu, ponieważ większość internautów skupia się na prawej stronie ektranu. Oznacza to, że interakcja pomiedzy miejscem a animacją musi być brana pod uwagę. Stąd funkcja odpowiedzi generycznych będzie mieć następującą formę:

LN(CTR/(1-CTR))= a + β1(obrazek po lewej) + β2( pozycja po prawej) + β3 (guzik call to action link na górze) + β4 (onimacja: tak) + β(reklama na stronie po lewej stronie) + β10( reklama na stronie po lewej stronie & animacja: tak).

Warto było by się dowiedzieć też o minimalnej liczbie eksperymentów, które trzeba przeprowadzić jeśli zakłada się obecność efektów interakcyjnych. Można łatwo zauważyć, że liczebność obserwacji powinna być bardzo duża jesli przewiduje się znaczną ilość efektów interakcji o różnym stopniu skomplikowania.

Aby wygenerować maksymalną wiedzę z każdego eksperymentu najlepiej jest przyjąć pełny projekt eksperymentalny gdzie wszystkie efekty są testowane. Niemniej jednak by zredukować koszty eksperymentu, można ograniczyć się do weryfikacji bardziej pożądanych efektów i spośród wszystkich wybrać tylko kilka.

Uwagi końcowe.

W tym wpisie opracowałem koncepcję projektowania eksperymentów. Do teraz miałeś intuicję o strategii konstruowania odpowiednich reklam przez firmy. Wcześniej firmy miały wiele problemów przy otrzymywaniu pozytywnych zwrotów z budżetu marketingowego. Powyższa technika nie tylko ratuje budżety, ale również pokazuje jak można ostrożnie i inteligentnie czerpać korzyści z tego typu działań w rynkowym poligonie.

 

ryzyko kredytowe analiza statystyczna ryzyka kredytowego

Modelowanie statystycznego systemu scoringowego.

meto

 

Statystyczny Scoring  – etapy budowy modelu karty scoringowej.

Kroki konstrukcji statystycznego modelu scoringowego.

– kumulacja danych o klientach

– charakterystyka klienta złego i dobrego.

– selekcja populacji na podstawie której konstultowany będzie model scoringowy

– eksploracja danych

– selekcja zmiennych do konstrukcji modelu statystycznego

– zbudowanie modelu statystycznego

– ocena podjętych kroków wraz z oceną modelu statystycznego – klasyfikacyjnego

– ustalenie tresholdu

– implementacja

– kontrola karty scoringowej

 

  1. Ocena statystyczna zmiennych potencjalnie mogących budować model.

Na tym etapie dokonuje się weryfikacji zmiennych pod kątem autentyczności (dokonuje się oceny miar tendencji centralnej i dyspersji), braków danych oraz obserwacji mogących potencjalnie wpływać znacząco na wyniki analiz statystycznych.

  1. Charakterystyka dobrego i złego klienta.

Definicja powinna opierać się o maksymalną nieterminową spłatę lub o maksymalny trwający limit spłaty zobowiązania. Może, ale nie musi opierać się o zmianę kondycji finansowej klienta.

  1. Selekcja populacji wschodzącej do zbioru uczącego i testowego.

Populację analizowana dzieli się na próbę uczącą/treningową (na której analiza statystyczna uczy się wzorców) oraz na populację testową na której testuje się wyselekcjonowaną analizę statystyczną.

  1. Weryfikacja statystyczna i selekcja zmiennych do modelu.

Do statystycznego modelu scoringowego selekcjonuje się zmienne, które pozwalają na dyskryminację złych i dobrych klientów oraz takie które przyjmują stabilną zmienność temporalną. Ponad to o selekcji zmiennych decyduje też logika biznesowa. Zazwyczaj zarząd lub menadżerowie wyższego szczebla doskonale się orientują w mocy predykcyjnej danych zmiennych. Podejściami w selekcji zmiennych jest na pierwszym miejscu wiedza ekspercka, statystyki zależności i różnic np. iloraz szans (ODDS RATIO), miara phi, eta kwadrat, d Cohena, miara KS, V Cramera, miara IV oraz WoE, procedury krokowe (postępowania lub eliminacji).

  1. Oszacowanie współczynników modelu i rating modelu pod względem jakości (wyrażonej w charakterystykach ilościowych).

Po selekcji odpowiedniego (pod względem jakości) modelu do predykcji ryzyka zasadne jest oszacowanie współczynników modelu. W praktyce testuje się następujące modele:

– regresja liniowa

– regresja logistyczna

– analiza dyskryminacyjna

– regresje Coxa

– drzewa decyzyjne

– SVM

Ilościowa ocena jakości modelu jest oceniana zazwyczaj po budowie i przetestowaniu modelu na populacji obserwacji testowych oraz obserwacjach z poza próby (np. na skrawkach informacji pozostałych w fazie wyboru próbki).

  1. Ustalenie tresholdu.

Punkt odcięcia jest punktem w którym ustala się sytuacje w której podejmuje się decyzję o udzieleniu bądź nie kredytu lub pożyczki. Pozwala to na przyspieszenie decyzji i ograniczenie czasu oczekiwania do kliku, niekiedy sekund. Można przyjąć punkt odcięcia w wysokości 0,5, może również minimalizować to ze względu na koszty podjęcia złych decyzji czyli kosztu nieudzielenia kredytu dobremu klientowi oraz udzielenia kredytu złemu klientowi.

  1. Kontrola karty scoringowej.

Personel banku powinien być edukowany w zakresie pojęcia i etyki jakim jest statystyczny credit scoring. Używanie scoringu powinno być ubrane w wystandaryzowane procedury polegające na ograniczeniu podejmowania decyzji innych niż sugerowanych przez scoring statystyczny. W uniwersum podejmowania decyzji innych niż zalecanych przez scoring, bank powinien nakreślić spektrum czynników mogących zmienić tę decyzję oraz ich odsetek. Każda niestandardowa decyzja powinna być wyrażona w odpowiednim raporcie.

  1. Implementacja i kontrolowanie karty scoringowej w czasie.

Plan implementacji nowej karty scoringowej w banku (który lepszy (champion challenger) jest strategią sprawdzenia pracy nowej karty scoringowej na żywej i nowej grupie klientów. Oczywiście na testowanie efektów potrzeba odpowiedniego upływu czasu, dlatego eksperymentowanie i majstrowanie w kartach scoringowych powinno być przemyślane i inteligentnie planowane