Архив выступлений: 2013-2014 учебный год, весенний семестр
Аннотация доклада.
Регулярные выражения — мощный и широко применяемый инструмент обработки текстовых данных. При поиске по регулярному выражению в большом наборе строк, становится актуальным вопрос о применении индекса. В то же время использование индексов для поиска по регулярному выражению – нетривиальная задача. Существует два основных подхода к выполнению поиска по регулярным выражениям с помощью индекса: «FREE indexing engine», основанный на выделении из регулярного выражения непрерывных фрагментов текста, а также метод, разработанный для Google Code Search, осуществляющий рекурсивный анализ составных частей регулярного выражения, с целью выявления его атрибутов. В целом оба этих подхода используют обратные индексы на основе k-грам (подстрок исходной строки длины k) и различаются методом извлечения k-грам из регулярного выражения для последующего поиска по индексу. Данный доклад представляет новый метод извлечений k-грам из регулярного выражения, основанный не на анализе исходного регулярного выражения, а на преобразовании соответствующего конечного автомата. Предлагаемый подход позволяет осуществить более полное извлечение k-грам из регулярного выражения, что подтверждается примерами. Данный подход был реализован в модуле pg_trgm СУБД PostgreSQL 9.3.
Аннотация доклада.
Доклад о применении технологии Linked Open Data (LOD) для построения библиотеки, содержащей персонализированный набор разного рода ресурсов, отвечающих предметной области интересов пользователя. LOD позволяет сделать поиск и выбор ресурсов, с одной стороны, простым для пользователя неспециалиста, с другой стороны, позволяющим совместить в библиотеке собственные данные и ресурсы из совершенно различных неоднородных источников, входящих в облако LOD. Предметная область определяется набором понятий, который определяет поисковые запросы. Описывается архитектура системы. Затрагиваются подходы к преодолению неоднородности словарей, диктуемые технологией LOD, подходы к структуризации неструктурированных и слабоструктурированных данных. Рассматривается возможность мониторинга изменений.
Аннотация доклада.
В докладе будет представлена общая архитектура системы ИСТИНА и принципы работы ее компонентов (модулей). Особое внимание будет уделено методам и средствам, применяющимся в ее базовых модулях (ядре), включая механизмы добавления новых типов результатов деятельности и редактирования данных. Часть доклада посвящена модулям автоматического тестирования и обеспечения безопасности системы. Доклад имеет практический характер, и в нем будут затронуты различные технические аспекты системы.
Аннотация доклада.
При построении информационных систем в современном обществе все чаще возникает требование распределенного хранения данных и предоставление быстрого доступа к данным территориально распределенным группам пользователей. В докладе будут рассмотрены основные технологии построения распределенных баз данных, различные способы репликации и особенности обмена данными с учетом структуры данных и топологии сети. Для иллюстрации рассматриваемых технологий в докладе будет проведена оценка их применимости для построения архитектуры системы ИСТИНА.
Аннотация доклада.
В докладе рассматриваются вопросы построения программного комплекса семантического поиска и обработки документов, обладающего функциональностью полнотекстового поиска и отвечающего высоким требованиям защиты информации. Комплекс обеспечивает различные режимы поиска (точный, релевантный, с- и без использования морфологических и семантических словарей), а также возможности комбинирования условий с помощью логических операций.
Механизмы защиты данных позволяют регулировать доступ пользователей к конкретным документам на основе мандатных и дискреционных моделей, при этом ограничение доступа распространяется как на сами документы, так и на связанную с ними информацию из полнотекстового индекса. Хранение и поиск данных обеспечиваются средствами СУБД ЛИНТЕР, сертифицированной на соответствие второму классу защиты информации от несанкционированного доступа.
Аннотация доклада.
Астрономия оперирует огромными объемами данных, поток которых непрерывно увеличивается вследствие успехов технологии производства высокочувствительных в разных диапазонах электромагнитого спектра и доступных сенсоров большого размера. Спецификой астрономических данных является их привязка к координатам на небесной сфере, что усложняет поисковые алгоритмы. Следует отметить, что с математической точки зрения астрономические данные не отличаются от данных, с которыми работают геоинформационные системы. Выбор СУБД для работы с астрономическими данными, таким образом, определяется (помимо стандартных требований) способностью эффективной работы с пространственными данными. В рамках проекта Виртуальной Обсерватории в ГАИШ МГУ нами были проведены исследования по применимости свободной СУБД PostgreSQL для хранилища астрономических каталогов и обеспечения основных сервисов. На выбор PostgreSQL повлияли следующие обстоятельства:
- PostgreSQL является наиболее продвинутой и зрелой из свободно-распространяемых СУБД с либеральной лицензией BSD;
- существует большое сообщество разработчиков и пользователей СУБД, в число которых входят и авторы;
- PostgreSQL является расширяемой СУБД, что позволило нам дополнить существующую функциональность новыми возможностями, направленные на эффективную работу с пространственными данными;
- PostgreSQL широко используется для работы с пространственными данными, в частности, его расширение PostGIS является наиболее известным OSS-решением для геоинформационных систем и совместимым с известными ГИС платформами как ArcGIS, QGIS.
Сравнивалась производительность нескольких алгоритмов работы с пространственными данными (более 10^9 астрономических объектов). Тестировались два основных астрономических запросов - радиальный запрос, который находит все объекты вокруг заданной точки в круге заданного радиуса, и кросс-матч (distant-base join), который сопоставляет два набора объектов по координатам (и иным атрибутам). В процессе работы удалось серьезно улучшить производительность существующих реализаций алгоритмов и получить рекомендации по их наиболее эффективному использованию, в зависимости от вида нагрузки.
Аннотация доклада.
Метод радикального моделирования базируется на концепции среды радикалов, использует формализм схем радикалов и предназначен для обеспечения единой информационной основы и полноты (избыточности, на случай нештатных ситуаций) представления проблемной области при решении задач жизненного цикла сложных систем широкого класса. На этом методе основывается интеллектуализация сложных систем. При радикальном моделировании формализация проблемной области сложной системы осуществляется с помощью схем радикалов, ориентированных на программную реализацию. В докладе рассматриваются вопросы применения предлагаемых средств в программной инженерии, а также схемы радикалов, характерные для проблемной области создания прикладного программного обеспечения сложных систем. Особое внимание уделено динамическому аспекту схем радикалов, сравнению их с конструкциями, которые характерны для некоторых известных программных средств.
Аннотация доклада.
Объекты исследования — стандарты шифрования, используемые в республике Узбекистан, а именно алгоритм создания электронной подписи и алгоритм шифрования данных — симметричный блочный шифр.
В алгоритме создания электронной подписи — ассиметричном шифре — в роли односторонней функции выступает возведение в степень с параметром. В докладе разбирается применимость этой операции в общем случае, а также рассматриваются групповые свойства этой операции. В целях выявления стойкости шифра на основе возведения в степень с параметром приведен алгоритм дискретного логарифмирования с оценкой сложности.
В симметричном блочном шифре в качестве функции рассеивания используется умножение на матрицу слева, а в качестве функции перемешивания — S-блоки, зависящие от сеансового ключа. Для формирования сеансовых ключей используется умножение с параметром. В докладе будет сделана оценка эффективности использования данных операций, поиск слабых ключей и сравнение с AES — алгоритмом шифрования, считающимся надежным.
Аннотация доклада.
В докладе рассматриваются вопросы построения формальной семантики параллельных программ с использованием общего подхода к формальной верификации программ на базе λ-исчисления с зависимыми типами и с использованием предметно-ориентированных языков. В рамках этого подхода представлена модификация построенной ранее модели динамического параллельного исполнения программ, которая допускает описание ограниченного класса программ с глобальным изменяемым состоянием.
Аннотация доклада.
В докладе будет представлено текущее состояние системы мониторинга работоспособности информационно-вычислительных сред FLAME. Будут рассмотрены вопросы апробации системы на различных конфигурациях, включая GRID- и Cloud-среды, а также намеченные пути ее дальнейшего развития.