Анализ блога Ильи Бирмана. Часть 3: визуализация.
В двух предыдущих заметках я рассказал, как собирал данные и приводил базовый анализ на самые-самые заметки:
- Сбор данных.
- Анализ данных.
- Визуализация.
Доступные данные
Скрипт собрал данные о 4565 заметках. По каждой есть: заголовок, дата, длина, количество картинок, просмотры, комментарии, тэги и ссылка на саму заметку.
Первые заметки в блоге датированы 2002 годом, последняя заметка — от 26 сентября 2019. Активность в 2002-2004 годах отличается от последующих: два месяца в 2002 (заметки импортированы в 2005), ещё восемь супер-активных месяцев в 2003, чуть менее бурная активность в 2004. С 2005 года и дальше более-менее равномерно.
Общий вид
Первое, что заметил — это стабильность Ильи: за всё время не было ни периодов тишины, ни каких-то взрывов активности.
Напоминает концепцию «20-мильного марша» из книги «Великие по собственному выбору». Авторы книги нашли общую особенность у великих людей и компаний: они выбирали темп и всегда его придерживались. В неблагоприятных условиях это закаляло дисциплину, а в хороших — удерживало от неконтролируемого роста.
Эту регулярность можно увидеть на тепловой карте ниже. Слева количество заметок в каждый месяц из 17 лет, а справа — средняя длина заметки.
Чтобы видеть выбросы, за «среднее» брал именно арифметическое среднее, а не медиану.

Аналитика уровня «пальцем в небо»: заметны относительно спокойные периоды и хочется найти в закономерность. Илья часто путешествует, а в путешествиях обычно столько всего интересного, что времени на блог остаётся меньше. Предположу, что «спокойные периоды» блога связаны именно с путешествиями: февраль..апрель и август..сентябрь в 2019, август в 2017, декабрь 2016..январь 2017.
Заметна тенденция: чем больше постов за месяц, тем больше их средняя длина. То есть Илья обычно пишет либо коротко и немного, либо и много, и длинно. Эту корреляцию можно увидеть на диаграмме рассеяния.

Динамику по годам количества заметок и их длины видно на диаграмме «ящик с усами»:

Интересные детали
Просмотры начали считаться с января 2018. Видимо, в это время движок блога научился их считать и показывать. На более ранних заметках счётчик просмотров может отсутствовать или показывать единицы просмотров.

На графике видны «выбросы» — месяцы с аномально высокими просмотрами. Заметки с самыми большими просмотрами я приводил в предыдущей заметке об анализе блога.
Вот они:
год | просмотры | тэги | |
О запятой после «С уважением» | 2006 | 87974 | русский язык |
Переплата по кредиту | 2013 | 39296 | жизнь, общество, экономика |
Числа π и e | 2012 | 14387 | математика |
Война | 2015 | 13601 | красная таблетка, общество |
Почему люди платят налоги | 2014 | 9310 | красная таблетка, общество, философия, экономика |
Комментарии. До 2012 заметки в блоге набирали большое количество комментариев, а с января 2012 они почти исчезли. Потом появлялись только для отдельных заметок.

Заметки после 2012 года с наибольшим количеством комментариев:
год | просмотры | комментарии | |
Почему люди платят налоги | 2014 | 11319 | 194 |
Дискуссии по понедельникам: что хорошего в патриотизме? | 2014 | 131 | 84 |
Где и как захостить мой сайт? | 2014 | 113 | 61 |
Какой купить ноутбук? | 2016 | 58 | 47 |
Типографская раскладка под Виндоусом 10 | 2016 | 520 | 45 |
В предыдущих сериях
- Cбор данных: заметка и код на ГитХабе
- Анализ данных: заметка и код на ГитХабе