Архив выступлений: 2011-2012 учебный год, осенний семестр

фото 18.10.2011
Д. Д. Голомазов (Мехмат МГУ, НИИ механики МГУ).
«К заполнению онтологии предметной области “наука”».

Аннотация доклада.

Онтологии являются одной из формальных моделей представления знаний. По существу онтология состоит из классов (понятий), экземпляров и связей между ними. Визуально онтологию можно представить в виде графа сущностей и связей.

Задача заполнения онтологии состоит в выделении из источников данных, например, текстов или HTML-страниц, экземпляров классов, определенных в онтологии, а также проставлении связей между ними. Например, если в онтологии определены такие классы, как “научное направление”, “задача”, “метод решения”, то задача заполнения онтологии состоит, во-первых, в составлении списков научных направлений (возможно, в виде иерархии), задач и методов решения, а во-вторых, проставлении связей между элементами списков, например, определении, какие задачи решает данный метод, к какому направлению относится данная задача и так далее.

В докладе будет представлен авторский подход к заполнению онтологии на примере предметной области “наука” на основе информации о конференциях. Суть подхода заключается в использовании относительно “надежных” данных (описаний конференций), а также информации из Интернет для выделения ключевых понятий предметной области, их классификации и проставления связей между ними. В первой части доклада будет описан алгоритм выделения информации о конференциях, в частности, ключевых слов, описывающих тематику конференций, а во второй части будет приведена методика организации полученных ключевых слов в онтологию, комбинирующая как лингвистические методы, например, шаблоны Херста, так и статистические, например, контекстный анализ и метрику Normalized Google Distance.