Analiza częstości publikowania wpisów na Metodolog.pl

Chociaż przeważająca część używanych w serii tekstów danych jest tekstowa, to – jak widać w powyższej tabeli – dysponujemy również jedną daną umożliwiającą bardziej konwencjonalną analizę, czyli datę. Głównym elementem naszego opracowania jest analiza tekstu, ale wiedzę na temat ewolucji bloga da również prześledzenie częstości, z jaką ukazywały się wpisy w poszczególnych okresach. Dlatego w tej części tekstu spróbujemy określić, w których okresach pojawiało się najwięcej wpisów, poszukać zależności między ich liczbą a czasem oraz zinterpretować wyniki.

Rozważymy okresy o długości:

  1. miesiąca,
  2. trzech miesięcy,
  3. sześciu miesięcy.

 

Do każdego wpisu przypisujemy charakterystyczny dla niego a-okres, na podstawie miesiąca, w którym został zamieszczony, począwszy od 1 (dla sierpnia 2015), a skończywszy na 33 (dla kwietnia 2018). B-okresy są tworzone jako zawierające a-okresy od 1 do 3 (dla b-okresu 1), od 4 do 6 (dla b-okresu 2) itd. Analogicznie jest z c-okresami.

Poprzez zliczenie, ile wpisów przypadło na określony okres, otrzymujemy poniższe wykresy. Dodana została na nich także linia trendu (utworzona metodą najmniejszych kwadratów).

Na wykresach widzimy, że w różnych miesiącach liczba publikowanych wpisów różniła się znacząco. Trudno na podstawie wykresów określić, co wpływało na zwiększanie się i zmniejszanie tej liczby – wahania nie miały charakteru okresowego, nie wydaje się też, aby występowało jakieś powiązanie liczby wpisów z okresami o większej ilości wolnego od pracy.

Można natomiast zauważyć, że z biegiem czasu liczba publikowanych wpisów zmniejsza się, co jasno pokazują linie trendu. Jest to prawdopodobnie związane z rozwojem firmy i tym, że od pewnego momentu jej strona była już wypromowana, a co za tym idzie – nie musiano wkładać tak dużo pracy w rozwój strony.