Архив выступлений: 2018-2019 учебный год, весенний семестр
Аннотация доклада.
В результате реализации проекта Cirtec, финансируемого РАНХиГС с июля 2016 г. (руководитель проекта Оксана Медведева), создан принципиально новый открытый и пополняемый массив данных о цитированиях в научных публикациях, содержащий, в том числе, контексты цитирований. На этих данных проведен предварительный анализ контекстов цитирований и построены некоторые уникальные показатели. Результаты проекта включают:
- подсистему «Извлечение данных о цитированиях» (ИДЦ), которая в автоматическом режиме превращает входной поток научных публикаций (метаданных и ссылок на полные тексты) в поток данных о содержании цитирований этих публикаций, накапливаемых и обновляемых в виде ХМЛ файлов в хранилище, доступном на http://cirtec.ranepa.ru/data/
- подсистему «Открытые данных о содержании цитирований» (ОДоСЦ), которая собирает статистику о работе ЦДЦ. Данная подсистема предоставляет пользователям актуальные сведения (ежедневное обновление) о процессах и результатах извлечения данных о цитированиях, а также визуализирует эту статистику для пользователей. Она доступна на http://cirtec.ranepa.ru/stats.html
- подсистему «Качественный анализ контекстов цитирований» (КАКЦ), которая использует данные, создаваемые ЦДЦ и ОДоСЦ, для анализа и классификаций цитирований в зависимости от их контекстов. Подсистема генерирует новые качественные и количественные показатели, полученные в результате анализа содержания цитирований. Показатели, создаваемые этой подсистемой, доступны на http://cirtec.ranepa.ru/analysis/ Данная онлайновая система является пока единственным для российского и международного научного сообщества примером создания комплекса показателей, формирующих новые стандарты в оценке характера использования учеными результатов друг друга и создающих условия для развития традиционной модели индекса цитирований.
Аннотация доклада.
Участие в научных конференциях является важной составляющей научной работы. Во многих областях знаний существуют общепризнанные периодические конференции, участие в которых является показателем высоких научных результатов. В то же время единые критерии оценки конференций отсутствуют. Значительное число мероприятий, которые ежегодно проводятся в мире по близким научным направлениям, затрудняет как процесс выбора мероприятия для представления собственных результатов, так и объективную количественную оценку сделанных докладов в контексте наукометрических систем. Только в области компьютерных наук ежегодно проводятся десятки тысяч конференций различного масштаба и уровня. В докладе формулируются возможные критерии формальной оценки качества научных мероприятий. Ставятся задачи в области обработки текстов и анализа социальных сетей, решение которых может способствовать автоматизации вычисления количественных оценок качества. Описываются предварительные практические результаты.
Аннотация доклада.
Рассмотрена технология автоматизированного комплексного тестирования особого класса систем – основанных на обработке xml-сообщений. Раскрыты особенности построения таких систем и связанные с ними особенности их тестирования. Особое внимание уделено тестированию при эксплуатации, сопровождении и развитии таких систем и его отличиям от тестирования при разработке. Предложен набор видов тестирования, необходимый для обеспечения комплексного регрессионного тестирования обсуждаемого класса систем. Для каждого вида тестирования рассмотрены используемые в них методы и способы их автоматизации. Показано, как методы тестирования и средства их автоматизации интегрируются в технологию комплексного тестирования выпусков системы в её жизненном цикле.
Аннотация доклада.
Доклад посвящен задаче классификации текстов на естественном языке. Эта задача решается методами машинного обучения. На основе заданной обучающей выборки и выбранной модели обучения строится классификатор (алгоритм, решающая процедура). Классификатор позволяет отнести входной текст к одному из заранее определенного набора классов.
В докладе будут рассмотрены традиционные подходы к решению задачи классификации, а также методы, основанные на использовании глубинных нейронных сетей. Основным предметом рассмотрения будет анализ возможности применения векторного представления слов типа Glove к решению задачи классификации текстов. Следует отметить, что изначально данное векторное представление разрабатывалось для решения других задач, а именно, задачи определения семантической близости слов и задачи поиска аналогий.
Аннотация доклада.
Рассмотрен инструментальный комплекс автоматизированного тестирования систем, основанных на обработке xml-сообщений. Показаны роль и место каждого инструментального средства в комплексе в технология автоматизированного комплексного тестирования систем, основанных на обработке xml-сообщений. Рассмотрены инструментальные средства функционального и нагрузочного тестирования. Особое внимание уделено вопросам автоматизированной генерации тестовых xml-сообщений, а также способам тестирования на основе сверки эталонных и формируемых тестируемой системой xml-сообщений Обсуждены результаты применения инструментального комплекса на практике.
Аннотация доклада.
Многие проблемы, связанные с (дискретными) управляющими системами, можно свести к решению уравнения A @ X ~ S для автоматных моделей, где X - свободная переменная, A – контекст, @ - оператор композиции, и ~ – отношение конформности. В большинстве известных работ рассматриваются уравнения относительно операций синхронной и параллельной композиции. Синхронная композиция соответствует «мгновенной» связи между компонентами системы. Параллельная композиция соответствует асинхронному взаимодействию, допускающему произвольную задержку между событиями, и используется в телекоммуникационных системах. В качестве отношений конформности рассматриваются отношения редукции и эквивалентности между автоматами, и, соответственно можно говорить об автоматных синхронных и параллельных неравенствах и уравнениях.
В [1] разработана теория для решения синхронных и параллельных неравенств и уравнений над формальными языками. В частности, неравенства и уравнения в алгебре регулярных языков эффективно решаются на основе конечно автоматных операторов. В некоторых приложениях могут потребоваться подмножества решений, имеющие дополнительные свойства. Соответственно, мы рассматриваем различные виды частных решений, таких как комбинационные решения, полностью определенные решения, прогрессивные решения и др.
Комбинационное решение эквивалентно автомату с одним состоянием и может быть использовано для разработки выигрышных / не проигрышных стратегий в логических играх, в то время как композиция контекста с прогрессивным решением не имеет тупиков и / или осцилляций. Для каждого вида вышеуказанных решений можно предложить методику получения соответствующего наибольшего решения. Полученные результаты можно распространить на решение уравнений для многокомпонентных композиций и относительно других операторов композиции.
[1] T. Villa, N. Yevtushenko, R. K. Brayton, A. Mishchenko, A. Petrenko, A. Sangiovanni-Vincentelli. The Unknown Component Problem. Springer, 2012.
Аннотация доклада.
При построении цифровых сервисов для решения задач историко-культурного сопровождения посетителей и сотрудников музея необходимо реализовать персонализированный отбор информации из информационного музейного хранилища (электронного каталога). Ранее нами было показано, что для отбора требуемой информации можно использовать дополнительный уровень - семантический. Он создается над каталого-ориентированным информационным хранилищем музея. Формируется семантическая сеть, в которой связываются различные информационные объекты из электронного каталога, из других доступных историко-культурных источников и объекты, создаваемые в процессе построения и развития сети. Семантика представлена в виде описательных атрибутов для таких объектов и в виде связей между объектами. Предлагается такую семантику использовать для персонализированного отбора информационных объектов для последующей доставки пользователю, т.е. реализуя цифровой сервис историко-культурного сопровождения.
В докладе представлены соответствующие модели и алгоритмы ранжирования.
Референтным примером выступает Музей истории Петрозаводского государственного университета. Разработаны цифровые сервисы построения персонализированных рекомендаций посетителям музея при изучении экспозиции, что требует различных вариантов ранжирования экспонатов и отбора экспонатов с наибольшим рангом.
Аннотация доклада.
Рассматривается распределённая сеть на базе динамического неориентированного графа связи. Трансформация графа выполняется не случайным образом, а по «командам» от вычислительных единиц, находящихся в вершинах графа. В качестве примера рассматривается самотрансформация дерева с использованием минимальной атомарной локальной «команды»: замена ребра ac на ребро ab. Такая «команда» может быть выдана вычислительной единицей, находящейся в вершине c, при условии наличия ребра cb. Вводится ограничение на максимальную степень вершины. В качестве цели самотрансформации дерева рассматривается минимизация индекса Винера – суммы попарных расстояний между вершинами. Для нумерованного упорядоченного дерева с ограничением на максимальную степень вершин предлагается алгоритм самотрансформации дерева, который минимизирует индекс Винера, и даётся оценка его сложности.
Аннотация доклада.
Интеллектуальное пространство развертывается в сетевой среде и обеспечивает создание, хранение и использование общего информационного хранилища множеством участников для совместного построения цифровых сервисов. Участники представлены разнообразными сетевыми вычислительными устройствами, как правило, мобильными. Для управления совместным созданием и использованием информации привлекается семантический информационный брокер (СИБ), который расширяет информационное хранилища до базы знаний и обеспечивает доступ к ней участников интеллектуального пространства. При росте числа участников, интенсивности их запросов и объемов передаваемых по сети данных нагрузка на СИБ может значительно возрастать.
В докладе рассматривается задача снижения нагрузки на СИБ с целью уменьшения информационных потерь, когда участник не получает требуемой актуальной информации (потеря запроса, пропуск информационного события и пр.). В соответствии с ранее полученными нами результатами, для снижения нагрузки на СИБ можно использовать активную стратегию в операции подписки (постоянный запрос на изменения информации), когда часть вычислений по проверке изменений делегируется на самого участника. Предлагается развитие такой активной стратегии за счет применения алгоритма случайной отсрочки (англ., backoff). В результате, число коллизий при обращении множества участников к СИБ уменьшается, что снижает объем вычислений, как на стороне СИБ, так и на самих участниках. При этом информационные потери остаются на уровне, сходном с применением участниками только активной стратегии.