• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Наше Выступление на MathLingvo

З декабря Кирилл Маслинский выступил с докладом на семинаре «Natural Language Processing», организованным проектом MathLingvo (кафедра Прикладной лингвистики филологического факультета СПбГУ)

З декабря Кирилл Маслинский выступил с докладом на семинаре «Natural Language Processing», организованным проектом MathLingvo (кафедра Прикладной лингвистики филологического факультета СПбГУ).  В докладе «Совмещение «экспертного» и «статистического» подходов к исследованию обсуждений в блогосфере (на примере темы ислама)» рассматриваются проблемы, связанные с преобразованием исследовательского представления об общественно значимой теме в  процедуры автоматического отбора релевантных текстов из коллекции блогов, а также обсуждаются методы оценки правомерности вычленения заданной исследователем темы и её места в структуре обсуждений в блогосфере в целом.

Кирилл рассказал об использовании двух независимых подходов для выявления общей совокупности текстов на заданную тему: традиционный «экспертный», в котором темы  отбираются при помощи списка ключевых слов, составленного на основании мнений экспертов, и «статистический», когда тематическая структура текстовой коллекций блогов анализируется полностью автоматически.

После доклада состоялась дискуссия, в ходе которой участники семинара задали большое количество вопросов. Вопросы касались в основном методики составления  списка ключевых слов в рамках «экспертного» метода, а также проблем, связанных с наличием в коллекции идентичных текстов (перепостов) при статистическом вычленении тем.