Сергей Кольцов о вычислительной социальной науке и тематическом моделировании
Вычислительная социальная наука призвана создать дизайн лучших обществ. Так ее задачу сформулировал Алекс Пентланд, основатель медиа-лаборатории Массачусетского технологического университета, на самой представительной в этой области конференции, организованной университетом Аалто в Хельсинки в июне 2015 года. «Нам очень повезло, что наш доклад приняли на эту конференцию, - сказал Сергей Кольцов, заместитель заведующего ЛИНИС.
Олеся Кольцова, заведующая ЛИНИС, Сергей Кольцов, зам.зав. ЛИНИС, И-Пенг Лим, директор научного центра живой аналитики, Сингапур. |
До создания дизайна обществ или хотя бы их подсистем вычислительная социальная наука еще должна пройти долгий путь, считает Сергей Кольцов. Пока она должна научиться осмысленно применять сложные математические алгоритмы к реальным социальным задачам и данным, а последние зачастую неполны, зашумлены и проблематичны с точки зрения соответствия «реальности» (ground truth). Одна из таких проблем, которую изучает Сергей, связана с LDA, популярным алгоритмом автоматического извлечения тем из больших текстовых коллекций. В принципе, LDA может быть мощным инструментом в руках социальных ученых, поскольку он дает им возможность быстро оценить тематический состав миллионов блогов, газетных статей, медицинских записей или других важных для социальных наук текстов. Но есть одна проблема: LDA выдает разные результаты каждый раз, когда его запускают на одних и тех же данных. Таким образом, никаких надежных выводов о тематической структуре этих данных сделать нельзя.
Эта проблема упускалась из виду, поскольку сперва качество алгоритма оценивали с помощью формальных метрик, обычно применяемых математиками (и эти метрики высоко оценивали LDA). Социальные исследователи могли видеть проблему «глазом с земли», но не могли предложить ее решения. Ситуация начала меняться, когда в игру вступили физики, объединив усилия и с математиками, и с социальными учеными. «Это и есть вычислительная социальная наука, - говорит Сергей Кольцов, - междисциплинарное сотрудничество с синергетическим результатом». Его метод стабилизации алгоритма, разработанный в лаборатории интернет-исследований, был хорошо принят аудиторией. «Мы получили полезную обратную связь от коллег из Англии, Финляндии, Катара и Сингапура. Мы надеемся, что часть этих контактов перерастет в международное сотрудничество».