Архив выступлений: 2013-2014 учебный год, осенний семестр

К. Лунев (НИИ механики МГУ, Мехмат МГУ).
«К вычислению смысловой близости двух предложений».

Аннотация доклада.

Проблема вычисление смысловой близости между предложениями является очень важной в задачах, связанных с Web. Примерами таких задач могут служить, например, автоматическое определение и коррекция неправильного употребления слов в тексте, кластеризация, обобщение и индексирование текстов. Определение семантической близости может заметно улучшить работу поисковых систем, которые используются повседневно миллионами людей. Эти знания могут использоваться для переформулировки запросов, выдачи более релевантного контента, сбора более качественной статистики от пользователей, улучшение работы поисковой рекламы. В настоящее время данная задача остается нерешенной.

В докладе будет представлен разработанный автором алгоритм и его программная реализация, основанные на идее разбиения каждого предложения на части «что», «где», «когда» и вычисления смысловой близости предложения путем анализа близости этих частей по отдельности.