• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Сергей Кольцов о вычислительной социальной науке и тематическом моделировании

Вычислительная социальная наука призвана создать дизайн лучших обществ. Так ее задачу сформулировал Алекс Пентланд, основатель медиа-лаборатории Массачусетского технологического университета, на самой представительной в этой области конференции, организованной университетом Аалто в Хельсинки в июне 2015 года. «Нам очень повезло, что наш доклад приняли на эту конференцию, - сказал Сергей Кольцов, заместитель заведующего ЛИНИС.

Олеся Кольцова, заведующая ЛИНИС, Сергей Кольцов, зам.зав. ЛИНИС, И-Пенг Лим, директор научного центра живой аналитики, Сингапур.
Олеся Кольцова, заведующая ЛИНИС, Сергей Кольцов, зам.зав. ЛИНИС, И-Пенг Лим, директор научного центра живой аналитики, Сингапур.
– Будучи первой конференцией такого рода, она привлекла таких звезд как Данкан Уоттс (Майкрософт Рисёч), Лада Адамик (Фэйсбук), Юре Лесковец (Стэнфорд), Ласцло Барабаши (Университет Нордистерн), Николас Кристакис (Йельский университет), Робин Данбар (Оксфорд)  и многих других. Эти исследователи известны далеко за пределами научных кругов; например, число Данбара можно найти в любом современном учебнике по психологии; это максимальное число друзей, с которым человек может поддерживать осмысленные отношения».

До создания дизайна обществ или хотя бы их подсистем вычислительная социальная наука еще должна пройти долгий путь, считает Сергей Кольцов.  Пока она должна научиться осмысленно применять сложные математические алгоритмы к реальным социальным задачам и данным, а последние зачастую неполны, зашумлены и проблематичны с точки зрения соответствия «реальности» (ground truth). Одна из таких проблем, которую изучает Сергей, связана с LDA, популярным алгоритмом автоматического извлечения тем из больших текстовых коллекций. В принципе, LDA может быть мощным инструментом в руках социальных ученых, поскольку он дает им возможность быстро оценить тематический состав миллионов блогов, газетных статей, медицинских записей или других важных для социальных наук текстов. Но есть одна проблема: LDA выдает разные результаты каждый раз, когда его запускают на одних и тех же данных. Таким образом, никаких надежных выводов о тематической структуре этих данных сделать нельзя.

Эта проблема упускалась из виду, поскольку сперва качество алгоритма оценивали с помощью формальных метрик, обычно применяемых математиками (и эти метрики высоко оценивали LDA). Социальные исследователи могли видеть проблему «глазом с земли», но не могли предложить ее решения. Ситуация начала меняться, когда в игру вступили физики, объединив усилия и с математиками, и с социальными учеными. «Это и есть вычислительная социальная наука, - говорит Сергей Кольцов, - междисциплинарное сотрудничество с синергетическим результатом». Его метод стабилизации алгоритма, разработанный в лаборатории интернет-исследований, был хорошо принят аудиторией. «Мы получили полезную обратную связь от коллег из Англии, Финляндии, Катара и Сингапура. Мы надеемся, что часть этих контактов перерастет в международное сотрудничество».