• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Разработка концепции и методологии многоуровневого мониторинга состояния межнациональных отношений по данным социальных сетей


Руководитель проекта:
Кольцова Е.Ю.
Исполнители проекта: Бодрунова С.С., Кольцов С.Н., Воронцов К.В., Николенко С.И., Потапенко А.А., Апишев М.А., Алексеева С.В., Юденкова Д.В.

Данный проект поддержан Российским Научным Фондом в 2015 году.
Задача проекта «Разработка концепции и методологии многоуровневого мониторинга состояния межнациональных отношений по данным социальных сетей» - дать государственным органам, общественным и исследовательским организациям протестированную методику и удобный инструмент для мониторинга обсуждения вопросов этничности и национальности пользователями интернета. Конечным результатом проекта должны стать методические рекомендации и программное обеспечение для анализа текстовых данных из социальных сетей. Основой метода мониторинга является тематическое моделирование – группа алгоритмов, анализирующих совместную встречаемость слов и на основании этого выявляющих скрытые темы в больших, не поддающихся чтению коллекциях текстов. Итогом работы алгоритма являются вероятности принадлежности текстов к темам и слов к темам, что дает пользователю представление о тематической структуре коллекции и вычленяет тексты, лучше всего репрезентирующие темы. Этот подход совмещается с автоматическим анализом тональности текстов, а также с визуализацией распределений тем, посвященных этничности, по регионам и по временным промежуткам.  Таким образом, аналитик получает наглядное представление о том, где, когда, с какой полярностью (негативной или позитивной) и в каком конкретном контексте обсуждаются те или иные этнические группы.
Подробнее...



2015

Publications

1. Sergey I. Nikolenko, Sergei Koltcov, Olessia Koltsova Topic modelling for qualitative studies, Journal of Information Science (2015)


Materials:

Topic modelling for qualitative studies (companion page for the corresponding paper)

TopicMiner (software adjusted for the purposes of monitoring ethnicity)



2016

Publications

1. M. Apishev, S. Koltsov, O. Koltsova, S.I. Nikolenko, K. Vorontsov. Mining Ethnic Content Online with Additively Regularized Topic Models // Computacion y Sistemas, vol. 20, no. 3, 2016, pp. 387–403

2. Nikolenko S.I. Topic Quality Metrics Based on Distributed Word Representations // Proc. 39th International ACM SIGIR Conference on Research and Development in Information Retrieval ( SIGIR 2016), 2016, pp. 1029–1032 ( ACM DL).

3. Apishev M. Parallel Non-blocking Deterministic Algorithm for Online Topic Modeling // Accepted to Proc. 5th International Conference on Analysis of Images, Social Networks, and Texts ( AIST 2016), 2016.

4. Bodrunova S. Who’s bad? Attitudes to re-settlers from post-Soviet South versus other nations in the Russian blogosphere // International Journal of Communication (under review).

 

Materials:

 Методическая записка "Качество данных IQBuzz и рекомендации по их использованию" (PDF, 226 Кб)

 Описание работ по усовершенствованию программного пакета TopicMiner в 2016 году (PDF, 235 Кб)

 Обучающая коллекция, размеченная по этнорелевантности (1000 текстов из 7181 текста) (XLSX, 292 Кб)

 /Полная коллекция будет доступна после публикации работ по ней/

 Словари, позволяющие выявлять различия между текстами с разными отношениями к этничности (верхние 50 слов) (ZIP, 3 Кб)

 /Полные словари будут доступны после публикации работ по ним/

 Список этнонимов по группам (TXT, 2 Кб)

 

Soft

Информационная система TopicMiner:

TopicMiner_LINIS








 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!