• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Разработка общедоступной базы данных и краудсорсингового веб-ресурса для создания инструментов сентимент-анализа (2014-2015)

Руководитель проекта: Кольцов С.Н.

Участники проекта: Алексеева С.В., Кольцова Е.Ю.

Данный проект поддержан Российским Гуманитарным Научным Фондом в 2014 году. Проект направлен на создание программного обеспечения, тонального словаря и базы данных, дающих возможность в дальнейшем разработать методику автоматического определения «эмоциональной заряженности» пользовательского интернет-контента. В сочетании с автоматическим извлечением тем это позволит социальным исследователям определять общественное мнение из пользовательских текстов – а именно, отношение интернет-активной части населения к разным социально значимым вопросам. В рамках проекта поставлены следующие задачи:

  1. извлечение потенциально тональных слов из имеющихся у Лаборатории интернет-исследований обширных коллекций текстов блогов социально политической-тематики;
  2. разметка получившегося «проекта» словаря добровольцами по технологии краудсорсинга;
  3. создание веб-интерфейса для краудсорсинга, которое затем будет доступно российским исследователям для организации разметки других словарей;
  4. создание размеченной тестовой коллекции и тестирование словаря.

Результатом проекта является краудсорсинговый веб-ресурсе система (http://linis-crowd.org/), а также коллекция готового тонального словаря и тестовые тестовых коллекций в свободном доступе на созданном веб-ресурсе. Таким образом, данный проект решает фундаментальную лингвистическую проблему отсутствия русскоязычного словаря тональной лексики для пользовательских текстов общественно-политической тематики


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!