• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Сети и тексты в Интернете: трудности и перспективы

Ежегодная конференция INSNA по сетевому анализу Sunbelt, состоявшаяся в 2013 году в Гамбурге 21-26 мая, ознаменовалась повышенным интересом к сетевым структурам в Интернете, а также вниманием к применению сетевого подхода для анализа текстовых данных, в том числе онлайновых. Одно из исследований, работающих с полнотекстовыми данными, было представлено  сотрудниками ЛИНИС Олесей Кольцовой и Сергеем Кольцовым.

Ежегодная конференция INSNA по сетевому анализу Sunbelt, состоявшаяся в 2013 году в Гамбурге 21-26 мая, ознаменовалась повышенным интересом к сетевым структурам в Интернете, а также вниманием к применению сетевого подхода для анализа текстовых данных, в том числе онлайновых.  Общими проблемами таких исследований остаются вопросы доступа к данным и построения выборок из больших сетей с неизвестными распределениями, неприменимости стандартной статистики к большим сетевым данным, вопросы соотношения онлайновых показателей с оффлайновой социальной реальностью. При совместном анализе сетей и текстов обнаруживаются трудности построения выборок текстов по тематике, недостаток эффективных инструментов сентимент-анализа  и трудности кросс-языковых исследований. Большое количество исследований сделано по Твиттеру как наиболее доступному сервису, однако в основном они основаны на анализе хэш-тэгов, а не полных данных так, изучается жизненный цикл и конкуренция хэш-тэгов, их распространение по сетям ретвитов и связность аккаунтов, употребляющих хэш-тэг. Одно из исследований, работающих с полнотекстовыми данными, было представлено  сотрудниками ЛИНИС Олесей Кольцовой и Сергеем Кольцовым. В исследовании сетей со-комментирования в Живом журнале установлена связь между принадлежностью постов к кластерам в сети со-комментирования и тематикой этих постов, выявленной с помощью тематического моделирования (на основе алгоритма LDA).  Таким образом, в исследовании показано, что блоггеры имеют некоторую тенеденцию группироваться в сообщества, комментирующие одни и те же группы постов, и эти группы до некоторой степени близки тематически.