Архив: 2018-2019, весенний семестр — Научный семинар «Проблемы современных информационно-вычислительных систем»

Архив выступлений: 2018-2019 учебный год, весенний семестр

26 февраля 2019 года

Паринов С. И. (Центральный экономико-математический институт РАН).

«Извлечение и анализ контекстов научных цитирований».

Аннотация доклада.

В результате реализации проекта Cirtec, финансируемого РАНХиГС с июля 2016 г. (руководитель проекта Оксана Медведева), создан принципиально новый открытый и пополняемый массив данных о цитированиях в научных публикациях, содержащий, в том числе, контексты цитирований. На этих данных проведен предварительный анализ контекстов цитирований и построены некоторые уникальные показатели. Результаты проекта включают:

подсистему «Извлечение данных о цитированиях» (ИДЦ), которая в автоматическом режиме превращает входной поток научных публикаций (метаданных и ссылок на полные тексты) в поток данных о содержании цитирований этих публикаций, накапливаемых и обновляемых в виде ХМЛ файлов в хранилище, доступном на http://cirtec.ranepa.ru/data/
подсистему «Открытые данных о содержании цитирований» (ОДоСЦ), которая собирает статистику о работе ЦДЦ. Данная подсистема предоставляет пользователям актуальные сведения (ежедневное обновление) о процессах и результатах извлечения данных о цитированиях, а также визуализирует эту статистику для пользователей. Она доступна на http://cirtec.ranepa.ru/stats.html
подсистему «Качественный анализ контекстов цитирований» (КАКЦ), которая использует данные, создаваемые ЦДЦ и ОДоСЦ, для анализа и классификаций цитирований в зависимости от их контекстов. Подсистема генерирует новые качественные и количественные показатели, полученные в результате анализа содержания цитирований. Показатели, создаваемые этой подсистемой, доступны на http://cirtec.ranepa.ru/analysis/ Данная онлайновая система является пока единственным для российского и международного научного сообщества примером создания комплекса показателей, формирующих новые стандарты в оценке характера использования учеными результатов друг друга и создающих условия для развития традиционной модели индекса цитирований.

5 марта 2019 года

Афонин С. А. (МГУ имени М.В. Ломоносова).

«Формальные критерии оценки степени авторитетности и значимости периодических научных мероприятий».

Аннотация доклада.

Участие в научных конференциях является важной составляющей научной работы. Во многих областях знаний существуют общепризнанные периодические конференции, участие в которых является показателем высоких научных результатов. В то же время единые критерии оценки конференций отсутствуют. Значительное число мероприятий, которые ежегодно проводятся в мире по близким научным направлениям, затрудняет как процесс выбора мероприятия для представления собственных результатов, так и объективную количественную оценку сделанных докладов в контексте наукометрических систем. Только в области компьютерных наук ежегодно проводятся десятки тысяч конференций различного масштаба и уровня. В докладе формулируются возможные критерии формальной оценки качества научных мероприятий. Ставятся задачи в области обработки текстов и анализа социальных сетей, решение которых может способствовать автоматизации вычисления количественных оценок качества. Описываются предварительные практические результаты.

12 марта 2019 года

Воеводин В.А., Галахов И.В., Позин Б.А. (EC-лизинг).

«Технология автоматизированного комплексного тестирования систем, основанных на обработке XML-сообщений».

Аннотация доклада.

Рассмотрена технология автоматизированного комплексного тестирования особого класса систем – основанных на обработке xml-сообщений. Раскрыты особенности построения таких систем и связанные с ними особенности их тестирования. Особое внимание уделено тестированию при эксплуатации, сопровождении и развитии таких систем и его отличиям от тестирования при разработке. Предложен набор видов тестирования, необходимый для обеспечения комплексного регрессионного тестирования обсуждаемого класса систем. Для каждого вида тестирования рассмотрены используемые в них методы и способы их автоматизации. Показано, как методы тестирования и средства их автоматизации интегрируются в технологию комплексного тестирования выпусков системы в её жизненном цикле.

19 марта 2019 года

Пехтерев С.И. (МГУ имени М.В. Ломоносова).

«Задача классификации текстов с помощью векторного представления слов типа Glove».

Аннотация доклада.

Доклад посвящен задаче классификации текстов на естественном языке. Эта задача решается методами машинного обучения. На основе заданной обучающей выборки и выбранной модели обучения строится классификатор (алгоритм, решающая процедура). Классификатор позволяет отнести входной текст к одному из заранее определенного набора классов.

В докладе будут рассмотрены традиционные подходы к решению задачи классификации, а также методы, основанные на использовании глубинных нейронных сетей. Основным предметом рассмотрения будет анализ возможности применения векторного представления слов типа Glove к решению задачи классификации текстов. Следует отметить, что изначально данное векторное представление разрабатывалось для решения других задач, а именно, задачи определения семантической близости слов и задачи поиска аналогий.

26 марта 2019 года

Воеводин В.А., Галахов И.В., Даниличев А.В., Позин Б.А. (EC-лизинг).

«Инструментальный комплекс для автоматизированного тестирования систем, основанных на обработке XML-сообщений».

Аннотация доклада.

Рассмотрен инструментальный комплекс автоматизированного тестирования систем, основанных на обработке xml-сообщений. Показаны роль и место каждого инструментального средства в комплексе в технология автоматизированного комплексного тестирования систем, основанных на обработке xml-сообщений. Рассмотрены инструментальные средства функционального и нагрузочного тестирования. Особое внимание уделено вопросам автоматизированной генерации тестовых xml-сообщений, а также способам тестирования на основе сверки эталонных и формируемых тестируемой системой xml-сообщений Обсуждены результаты применения инструментального комплекса на практике.

2 апреля 2019 года

Евтушенко Н.В. (ИСП РАН).

«О решении автоматных уравнений».

Аннотация доклада.

Многие проблемы, связанные с (дискретными) управляющими системами, можно свести к решению уравнения A @ X ~ S для автоматных моделей, где X - свободная переменная, A – контекст, @ - оператор композиции, и ~ – отношение конформности. В большинстве известных работ рассматриваются уравнения относительно операций синхронной и параллельной композиции. Синхронная композиция соответствует «мгновенной» связи между компонентами системы. Параллельная композиция соответствует асинхронному взаимодействию, допускающему произвольную задержку между событиями, и используется в телекоммуникационных системах. В качестве отношений конформности рассматриваются отношения редукции и эквивалентности между автоматами, и, соответственно можно говорить об автоматных синхронных и параллельных неравенствах и уравнениях.

В [1] разработана теория для решения синхронных и параллельных неравенств и уравнений над формальными языками. В частности, неравенства и уравнения в алгебре регулярных языков эффективно решаются на основе конечно автоматных операторов. В некоторых приложениях могут потребоваться подмножества решений, имеющие дополнительные свойства. Соответственно, мы рассматриваем различные виды частных решений, таких как комбинационные решения, полностью определенные решения, прогрессивные решения и др.

Комбинационное решение эквивалентно автомату с одним состоянием и может быть использовано для разработки выигрышных / не проигрышных стратегий в логических играх, в то время как композиция контекста с прогрессивным решением не имеет тупиков и / или осцилляций. Для каждого вида вышеуказанных решений можно предложить методику получения соответствующего наибольшего решения. Полученные результаты можно распространить на решение уравнений для многокомпонентных композиций и относительно других операторов композиции.

[1] T. Villa, N. Yevtushenko, R. K. Brayton, A. Mishchenko, A. Petrenko, A. Sangiovanni-Vincentelli. The Unknown Component Problem. Springer, 2012.

9 апреля 2019 года

Петрина О.Б., Корзун Д.Ж. (Петрозаводский государственный университет).

«Алгоритмы ранжирования информации на основе семантической сети при построении цифровых сервисов персонализированного сопровождения деятельности музея».

Аннотация доклада.

При построении цифровых сервисов для решения задач историко-культурного сопровождения посетителей и сотрудников музея необходимо реализовать персонализированный отбор информации из информационного музейного хранилища (электронного каталога). Ранее нами было показано, что для отбора требуемой информации можно использовать дополнительный уровень - семантический. Он создается над каталого-ориентированным информационным хранилищем музея. Формируется семантическая сеть, в которой связываются различные информационные объекты из электронного каталога, из других доступных историко-культурных источников и объекты, создаваемые в процессе построения и развития сети. Семантика представлена в виде описательных атрибутов для таких объектов и в виде связей между объектами. Предлагается такую семантику использовать для персонализированного отбора информационных объектов для последующей доставки пользователю, т.е. реализуя цифровой сервис историко-культурного сопровождения.

В докладе представлены соответствующие модели и алгоритмы ранжирования.

Референтным примером выступает Музей истории Петрозаводского государственного университета. Разработаны цифровые сервисы построения персонализированных рекомендаций посетителям музея при изучении экспозиции, что требует различных вариантов ранжирования экспонатов и отбора экспонатов с наибольшим рангом.

16 апреля 2019 года

Бурдонов И. Б. (ИСП РАН).

«Самотрансформирующиеся графы».

Аннотация доклада.

Рассматривается распределённая сеть на базе динамического неориентированного графа связи. Трансформация графа выполняется не случайным образом, а по «командам» от вычислительных единиц, находящихся в вершинах графа. В качестве примера рассматривается самотрансформация дерева с использованием минимальной атомарной локальной «команды»: замена ребра ac на ребро ab. Такая «команда» может быть выдана вычислительной единицей, находящейся в вершине c, при условии наличия ребра cb. Вводится ограничение на максимальную степень вершины. В качестве цели самотрансформации дерева рассматривается минимизация индекса Винера – суммы попарных расстояний между вершинами. Для нумерованного упорядоченного дерева с ограничением на максимальную степень вершин предлагается алгоритм самотрансформации дерева, который минимизирует индекс Винера, и даётся оценка его сложности.

23 апреля 2019 года

Богоявленская О.Ю., Корзун Д.Ж., Кулаков К.А. (Петрозаводский государственный университет).

«Применение алгоритма случайной отсрочки при активной стратегии».

Аннотация доклада.

Интеллектуальное пространство развертывается в сетевой среде и обеспечивает создание, хранение и использование общего информационного хранилища множеством участников для совместного построения цифровых сервисов. Участники представлены разнообразными сетевыми вычислительными устройствами, как правило, мобильными. Для управления совместным созданием и использованием информации привлекается семантический информационный брокер (СИБ), который расширяет информационное хранилища до базы знаний и обеспечивает доступ к ней участников интеллектуального пространства. При росте числа участников, интенсивности их запросов и объемов передаваемых по сети данных нагрузка на СИБ может значительно возрастать.

В докладе рассматривается задача снижения нагрузки на СИБ с целью уменьшения информационных потерь, когда участник не получает требуемой актуальной информации (потеря запроса, пропуск информационного события и пр.). В соответствии с ранее полученными нами результатами, для снижения нагрузки на СИБ можно использовать активную стратегию в операции подписки (постоянный запрос на изменения информации), когда часть вычислений по проверке изменений делегируется на самого участника. Предлагается развитие такой активной стратегии за счет применения алгоритма случайной отсрочки (англ., backoff). В результате, число коллизий при обращении множества участников к СИБ уменьшается, что снижает объем вычислений, как на стороне СИБ, так и на самих участниках. При этом информационные потери остаются на уровне, сходном с применением участниками только активной стратегии.