Архив выступлений: 2018-2019 учебный год, весенний семестр
«Извлечение и анализ контекстов научных цитирований».
Аннотация доклада.
В результате реализации проекта Cirtec, финансируемого РАНХиГС с июля 2016 г. (руководитель проекта Оксана Медведева), создан принципиально новый открытый и пополняемый массив данных о цитированиях в научных публикациях, содержащий, в том числе, контексты цитирований. На этих данных проведен предварительный анализ контекстов цитирований и построены некоторые уникальные показатели. Результаты проекта включают:
- подсистему «Извлечение данных о цитированиях» (ИДЦ), которая в автоматическом режиме превращает входной поток научных публикаций (метаданных и ссылок на полные тексты) в поток данных о содержании цитирований этих публикаций, накапливаемых и обновляемых в виде ХМЛ файлов в хранилище, доступном на http://cirtec.ranepa.ru/data/
- подсистему «Открытые данных о содержании цитирований» (ОДоСЦ), которая собирает статистику о работе ЦДЦ. Данная подсистема предоставляет пользователям актуальные сведения (ежедневное обновление) о процессах и результатах извлечения данных о цитированиях, а также визуализирует эту статистику для пользователей. Она доступна на http://cirtec.ranepa.ru/stats.html
- подсистему «Качественный анализ контекстов цитирований» (КАКЦ), которая использует данные, создаваемые ЦДЦ и ОДоСЦ, для анализа и классификаций цитирований в зависимости от их контекстов. Подсистема генерирует новые качественные и количественные показатели, полученные в результате анализа содержания цитирований. Показатели, создаваемые этой подсистемой, доступны на http://cirtec.ranepa.ru/analysis/ Данная онлайновая система является пока единственным для российского и международного научного сообщества примером создания комплекса показателей, формирующих новые стандарты в оценке характера использования учеными результатов друг друга и создающих условия для развития традиционной модели индекса цитирований.