Архив выступлений: 2018-2019 учебный год, осенний семестр

Шачнев Д. А. (МГУ имени М.В. Ломоносова).
«Методы определения тематической схожести документов, на примере поиска схожих диссертационных советов МГУ».

Аннотация доклада.

В докладе будут рассмотрены методы и средства: тематической классификации документов по ключевым словам; составления тематического профиля документа или коллекции документов; сравнения двух документов и вычисления коэффициентов схожести. Представлен краткий обзор существующих методов; описаны доработки, адаптирующие данные методы для работы в информационных системах с большим количеством связанных объектов.

Будет описана возможность использования в алгоритме базы семантически связанных ключевых слов с указанием их коэффициентов схожести, которая строится по независимой коллекции документов.

В качестве примера документов рассматриваются диссертационные советы в базе данных наукометрической системы. Продемонстрировано построение профиля диссертационного совета,