Архив выступлений: 2018-2019 учебный год, весенний семестр

Паринов С. И. (Центральный экономико-математический институт РАН).
«Извлечение и анализ контекстов научных цитирований».

Аннотация доклада.

В результате реализации проекта Cirtec, финансируемого РАНХиГС с июля 2016 г. (руководитель проекта Оксана Медведева), создан принципиально новый открытый и пополняемый массив данных о цитированиях в научных публикациях, содержащий, в том числе, контексты цитирований. На этих данных проведен предварительный анализ контекстов цитирований и построены некоторые уникальные показатели. Результаты проекта включают:

  • подсистему «Извлечение данных о цитированиях» (ИДЦ), которая в автоматическом режиме превращает входной поток научных публикаций (метаданных и ссылок на полные тексты) в поток данных о содержании цитирований этих публикаций, накапливаемых и обновляемых в виде ХМЛ файлов в хранилище, доступном на http://cirtec.ranepa.ru/data/
  • подсистему «Открытые данных о содержании цитирований» (ОДоСЦ), которая собирает статистику о работе ЦДЦ. Данная подсистема предоставляет пользователям актуальные сведения (ежедневное обновление) о процессах и результатах извлечения данных о цитированиях, а также визуализирует эту статистику для пользователей. Она доступна на http://cirtec.ranepa.ru/stats.html
  • подсистему «Качественный анализ контекстов цитирований» (КАКЦ), которая использует данные, создаваемые ЦДЦ и ОДоСЦ, для анализа и классификаций цитирований в зависимости от их контекстов. Подсистема генерирует новые качественные и количественные показатели, полученные в результате анализа содержания цитирований. Показатели, создаваемые этой подсистемой, доступны на http://cirtec.ranepa.ru/analysis/ Данная онлайновая система является пока единственным для российского и международного научного сообщества примером создания комплекса показателей, формирующих новые стандарты в оценке характера использования учеными результатов друг друга и создающих условия для развития традиционной модели индекса цитирований.