• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Формирование повестки дня и общественного мнения в российской блогосфере (2012-2013)

Руководитель проекта: Кольцова Е.Ю.
Участники проекта: Кольцов С.Н., Николенко С.И., Маслинский К.А., Ефимова Т.Г., Алексеева С.В., Шиморина А. С.

Это двухлетнее исследование – основной подпроект работы, проводившейся ЛИнИс по гранту ЦФИ НИУ ВШЭ в 2012 и 2013 годах; оно продолжило проект лаборатории 2011 года, который был направлен на разработку методики социологического анализа блогосферы. Задачей исследования стало описание тематической структуры блогосферы по разработанной ранее методике на примере Живого Журнала. Данные для проекта закачивались автоматически из Живого Журнала с помощью программного обеспечения ЛИнИс BlogMiner; за два года было создано около ста реляционных баз данных, которые в общей сложности содержат почти 4 миллиона постов и примерно в двадцать раз больше комментариев, а также данные о связи между ними, даты и ники их авторов. Также в ходе проекта было разработанно аналитическое интерфейсное программное обеспечение TopicMiner, использовавшееся на последних этапах проекта. Тематическая структура Живого журнала выявлялась на материале больших выборок с помощью алгоритма тематического моделирования, называемого латентное размещение Дирихле с сэмплированием Гиббса. Исследовались связи тематической структуры с другими характеристиками блогосферы.
В частности, установлено, общая тематическая структура не меняется во времени, и вес общественно-политических тем в общем массиве примерно равен весу приватно-рекреационных тем. Однако внутри социально-политической группы существует наиболее изменчивый сегмент событийных тем, которые вносят основной вклад в разницу между различными периодами времени; в особенности это было заметно при сравнении периодов до и во время выборов 2011-2012 годов. Также установлено, что тематика постов популярных блоггеров не отличается от тематики обычных авторов, не занимающих высокие места в рейтингах. Зато обычные блоггеры отличаются существенно более низкой активностью и зашуленностью данных спаммерскими аккаунтами. При исследовании других характеристик блогосферы было, среди прочего, выявлено, что количество полученных блоггером комментариев слабо коррелирует с количеством постов, что дает возможность строить индекс «эффективности» блоггера на основании расчета среднего количества комментариев на пост блоггера. Выявлено, что хотя блоги политематичны, в некоторых блогах превалируют определенные группы тем, что дает возможность строить тематические «профили» блоггеров и затем кластеризовать блоггеров по этим профилям. Установлен объем колебаний общей активности блоггеров по дням недели и по времени суток (в выходные примерно на четверть ниже у популярных и у обычных блоггерах), что дает возможность вычислять поправочные коэффициенты для корректного выявления пиков активности блогосферы в целом.

 

Публикации

 

Материалы

 

Использованное программное обеспечение:


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!