Наше Выступление на MathLingvo
З декабря Кирилл Маслинский выступил с докладом на семинаре «Natural Language Processing», организованным проектом MathLingvo (кафедра Прикладной лингвистики филологического факультета СПбГУ)
З декабря Кирилл Маслинский выступил с докладом на семинаре «Natural Language Processing», организованным проектом MathLingvo (кафедра Прикладной лингвистики филологического факультета СПбГУ). В докладе «Совмещение «экспертного» и «статистического» подходов к исследованию обсуждений в блогосфере (на примере темы ислама)» рассматриваются проблемы, связанные с преобразованием исследовательского представления об общественно значимой теме в процедуры автоматического отбора релевантных текстов из коллекции блогов, а также обсуждаются методы оценки правомерности вычленения заданной исследователем темы и её места в структуре обсуждений в блогосфере в целом.
Кирилл рассказал об использовании двух независимых подходов для выявления общей совокупности текстов на заданную тему: традиционный «экспертный», в котором темы отбираются при помощи списка ключевых слов, составленного на основании мнений экспертов, и «статистический», когда тематическая структура текстовой коллекций блогов анализируется полностью автоматически.
После доклада состоялась дискуссия, в ходе которой участники семинара задали большое количество вопросов. Вопросы касались в основном методики составления списка ключевых слов в рамках «экспертного» метода, а также проблем, связанных с наличием в коллекции идентичных текстов (перепостов) при статистическом вычленении тем.