Архив выступлений: 2011-2012 учебный год, осенний семестр

Аннотация доклада.
Онтологии являются одной из формальных моделей представления знаний. По существу онтология состоит из классов (понятий), экземпляров и связей между ними. Визуально онтологию можно представить в виде графа сущностей и связей.
Задача заполнения онтологии состоит в выделении из источников данных, например, текстов или HTML-страниц, экземпляров классов, определенных в онтологии, а также проставлении связей между ними. Например, если в онтологии определены такие классы, как “научное направление”, “задача”, “метод решения”, то задача заполнения онтологии состоит, во-первых, в составлении списков научных направлений (возможно, в виде иерархии), задач и методов решения, а во-вторых, проставлении связей между элементами списков, например, определении, какие задачи решает данный метод, к какому направлению относится данная задача и так далее.
В докладе будет представлен авторский подход к заполнению онтологии на примере предметной области “наука” на основе информации о конференциях. Суть подхода заключается в использовании относительно “надежных” данных (описаний конференций), а также информации из Интернет для выделения ключевых понятий предметной области, их классификации и проставления связей между ними. В первой части доклада будет описан алгоритм выделения информации о конференциях, в частности, ключевых слов, описывающих тематику конференций, а во второй части будет приведена методика организации полученных ключевых слов в онтологию, комбинирующая как лингвистические методы, например, шаблоны Херста, так и статистические, например, контекстный анализ и метрику Normalized Google Distance.