Архив выступлений: 2015-2016 учебный год, осенний семестр

А. А. Артемов (ВМК МГУ).
«Математическое моделирование процесса изменения содержания информационного пространства социума».

Аннотация доклада.

В докладе предлагается подход к моделированию процесса изменения содержания информационного пространства (ИП) социума с учетом силы информационного воздействия на его структурные элементы.

Современная система массовых коммуникации социума, рассматривается автором, как сложно-структурированная – социально-телекоммуникационная система (СТС), где социальные группы людей интегрированы с телекоммуникационными системами в многоканальной коммуникационной парадигме. Автор выдвигает гипотезу, что информационное пространство современного общества, может быть описано динамикой содержания информационных сообщений, распространяемых с использованием средств массовой коммуникации.

Задача, по определению минимальных структурных элементов содержания информационного сообщения, единиц их измерения и оценки в данных единицах количественных и качественных характеристик информационного пространства, решается автором благодаря синтезу методов когнитивной лингвистики на базе n-gramm (Харрис, Гензер, Чарняк), подходов культурной эволюции – меметики (Докинз, Броди, Блэкмор), вероятностной моделью языка (Налимов), теории информационного противоборства (Расторгуев) и теории системно-когнитивного анализа (Луценко).

В качестве направления для дальнейших исследовании, автор предлагает подходы: к оценке силы информационного воздействия на единичные элементы ИП СТС, определяемую через вероятность нахождения (появление или гибель) мема в информационном пространстве; к прогнозированию содержания информационного пространства, с учетом уровня системности/эмерджетности моделей знаний (мемплексов). Кроме теоретического материала, автором представлены результаты анализа информационного пространства русскоязычного сегмента ИП СТС (3000 публикаций за июль–август 2014 года), полученные с использованием предлагаемого им подхода. Результат анализа содержит расчеты вероятностей, агрессивности и силы воздействия для ТОП 30 из 600 выявленных мемов в русскоязычном сегменте ИП СТС.

К. В. Лунев (Мехмат МГУ, НИИ механики МГУ).
«Методы построения иерархических классификаторов научных направлений и алгоритмы автоматической кластеризации научных сотрудников и научных коллективов на основе анализа контекстной информации».

Аннотация доклада.

Существующие вручную составленные классификаторы научных направлений имеют ряд недостатков:

  • существующие классы имеют абстрактный смысл и нуждаются в конкретизации;
  • системы являются статическими и не отражают изменения тенденций в научной среде;
  • вследствие трудоемкости разработки таких систем, классификаторы стремятся покрыть всю область научных направлений, что затрудняет применение таких классификаторов общего назначения в более специализированных задачах.

В работе рассматриваются подходы к решению задачи автоматического построения иерархических классификаторов научных направлений. В дополнение приводятся алгоритмы поиска экспертов, наиболее релевантных поисковому запросу, и методы кластеризации сотрудников по заданным критериям.

Основным источником информации при решении данных задач являются наборы ключевых слов, ассоциированные с конкретными статьями, сотрудниками и группами.

Кроме того используются дополнительные знания об объектах системы: соавторства, годы публикаций, аннотации и тексты статей, составы коллективов, научные интересы сотрудников и другие.

Решению задачи способствуют разработанные алгоритмы определения близости между ключевыми словами, а также между наборами ключевых слов.

А. М. Шестов (Мехмат МГУ).
«Многомасштабное описание трехмерной структуры молекулярного графа для решения задачи «структура-свойство»».

Аннотация доклада.

Одной из ключевых задач прикладной математики в химии является задача поиска количественных соотношений «структура–свойство», которая состоит в поиске численной зависимости между структурой молекулы химического соединения и её физико-химическими свойствами или биологической активностью. С точки зрения математики задача является частным случаем задачи распознавания образов. Задачу можно условно разделить на две части - построение математического описания структуры молекул и решение задачи классификации/регрессии для полученного описания. В данном докладе рассматривается новый метод описания структуры молекул. Основу метода составляет нахождение структурных элементов на молекулярной поверхности, которые соответствуют областям однородных физико-химических и геометрических свойств. В докладе будут описаны метод, детали реализации, вычислительная сложность, показатели качества на тестовых выборках и сравнение качества с аналогами.

С. А. Артамкин, Г. А. Богопольский, О. В. Глебова, Д. С. Карпенко (РНИМУ им. Н. И. Пирогова).
«Проект информатизации учебного процесса вуза (на примере РНИМУ), ориентация на решение ключевых задач вуза».

Аннотация доклада.

Решения для вузов, объединяющего в единый комплекс основные бизнес-процессы, в настоящий момент не существует. Это вынуждает ИТ коллективы заниматься интеграцией отдельных решений различных производителей (электронный деканат, E-Learning, электронный документооборот, электронная библиотека, СКУД и пр.). По этому пути шел и РНИМУ им. Н.И. Пирогова.

Разработанные в разное время, на разных платформах, находящиеся на разных стадиях жизненного цикла программные решения, потребовали значительных затрат, но не позволили создать единую информационно-образовательную среду Университета.

Отталкиваясь от полученного опыта реализации ИТ-проектов (в том числе собственного), в 2013 году в РНИМУ сформулированы следующие основные цели и задачи информатизации учебного процесса:

  • построение единой системы управления знаниями вуза, с возможностью определения и сокращения разрыва знаний между выпускниками вуза и требованиями работодателей;
  • увеличение интенсивности учебного процесса, в том числе за счет увеличения внеаудиторной нагрузки учащихся.
  • обеспечение объективности аттестации учебных достижений учащихся, построение БРС;
  • обеспечение единой сквозной системы электронного документооборота, связанного с документированием, учетом и контролем образовательной деятельности.
  • повышение производительности труда основных участников учебного процесса, снижение рутинных, неинтеллектуальных видов деятельности.
  • повышение эффективности управления по всем направлениям образовательной деятельности вуза.
О. Н. Шорин (Российская национальная библиотека).
«Семантическая интеграция библиографических записей национальной электронной библиотеки».

Аннотация доклада.

В Министерстве культуры Российской Федерации предпринимаются попытки, направленные на реализацию нового этапа развития Национальной электронной библиотеки (НЭБ). Основной целью этого этапа является обеспечение свободного, равного и всеобщего доступа граждан нашей страны к документной информации историко-культурного, научного и образовательного назначения через сеть Интернет, предоставляемой на основе единой общенациональной системы создания и эффективного использования цифровых библиотечно-информационных ресурсов и сервисов.

Следуя парадигме открытости данных, была осуществлена публикация библиографических записей библиотек, входящих в состав НЭБ, в соответствии с принципами Linked Open Data. Реализация данного проекта позволила получить доступ к библиографической информации, хранящейся в ряде крупнейших библиотек России, в виде, пригодном для машинной обработки. Набор данных состоит из нескольких десятков миллионов записей. Наличие открытого доступа к одному из самых крупных в мире массиву библиографической информации с возможностью обнаружения семантически связанных данных является одной из составляющих развития как культуры в целом, так и отдельных направлений книжной отрасли в частности.

В процессе семантической интеграции были решены несколько актуальных задач: разработана онтология предметной области, произведена конвертация библиографических данных из различных MARC-форматов в RDF, создан эффективный алгоритм поиска нечетких дубликатов среди большого количества записей, осуществлена публикация данных и предоставлена SPARQL точка доступа к ним.

Для выявления дублетных библиографических записей используется функция из семейства locality-sensitive hashing c дополнительными оптимизациями. Выявленные таким образом записи сравниваются друг с другом с помощью меры Жаккара для принятия окончательного решения о дублетности и осуществления слияния нескольких записей в одну. Полученные библиографические записи семантически связывались с данными из Библиотеки конгресса США, Британской национальной библиотекой и DBPedia. Для каждого из источников был создан модуль, который осуществлял поиск по заданному выражению и возвращал найденные результаты. Для отсечения заведомо неподходящих кандидатов для установления связи owl:sameAs отдельные поля библиографических записей разбивались на множества биграмм. Используя меру Жаккара, вычислялось расстояние между строками библиографических записей. Для тех пар записей, у которых мера превышала установленный порог, производилось связывание.

Основными научными и практическими результатами являются:

  • аналитическая модель построения модульных систем для сбора и последующей обработки библиографических записей;
  • алгоритм выявления дублетных библиографических записей и создания на их основе обогащенных данных, позволяющий минимизировать количество попарно сравниваемых записей;
  • разработанный набор XSLT-шаблонов для преобразования библиографических записей из различных форматов в формат, пригодный для публикации в LOD, в соответствии с существующей онтологией;
  • алгоритм связывания библиографических данных с уже опубликованными в LOD сведениями, поставляемыми различными организациями;
  • модульная система интеграции библиографических данных, позволяющая в автоматическом режиме осуществлять сбор библиографических записей из библиотек, проводить обогащение данных на основе полученной информации, конвертировать сведения в формат, пригодный для публикации в LOD, и устанавливать связи с уже опубликованными в LOD данными.
М. Д. Дзабраев, В. А. Роганов (Мехмат МГУ, НИИ механики МГУ).
«Экспресс-анализ текстовых данных на предмет вхождения в них ключевых слов и фраз».

Аннотация доклада.

Средства анализа текстовых данных представляют собой важный инструментарий для мониторинга как Интернет-пространства, так и трафика частных сетей, внося все более заметный вклад в обеспечение информационной безопасности.

Рассматривается задача быстрого обнаружения ключевых слов и фраз в потоках текстовых данных. Ключевым моментом при решении этой задачи является производительность программы-анализатора, которая должна обеспечивать обработку интенсивных потоков в режиме реального времени. Рассматриваются как классические алгоритмы для проведения такого анализа, так и их модификации, перспективные с точки зрения реализации на современных многоядерных платформах и спецвычислителях.

В. Ю. Бухонов (Мехмат МГУ).
«Обработка персональных данных в ИАС «Наука-МГУ» («ИСТИНА»)».

Аннотация доклада.

Доклад посвящён вопросам обработки персональных данных в ИАС «Наука-МГУ» («ИСТИНА»). Особое внимание будет уделено вопросам, связанным с анализом нормативных документов, в докладе показаны их связь и приложение к системе. Будут рассмотрены различные типы угроз, связанные с обработкой персональных данных, основные модели нарушителя, представлен краткий анализ их отношения к системе ИСТИНА. По результатам такого анализа определяется её соответствие одному из уровней защищённости в соответствии с принятыми в РФ нормативными документами.

С. Г. Елизаров (Физический факультет МГУ).
«Специализированные многопотоковые процессоры с аппаратной поддержкой общей памяти с дополнительными признаками данных».

Аннотация доклада.

В докладе рассматривается архитектура и реализация на ПЛИС специализированных многоядерных (содержащих сотни и/или тысячи предельно простых вычислительных ядер) процессоров с разрешением конфликтов одновременного доступа к данным на уровне контроллера общей памяти и аппаратными механизмами планирования и исполнения легких потоков.

С. И. Паринов (ЦЭМИ РАН).
«Научные информационные системы и модернизация научного процесса».

Аннотация доклада.

Система Соционет (https://socionet.ru) как пример современной научной информационной системы. Подсистема "информационный хаб". Формирование научного информационного пространства. Интероперабельность. Новые возможности для авторов публикаций. Новые возможности исследовательских организаций. Открытые репозитории организаций. Оценка научной результативности ученых и организаций. Поддержка принципов Открытой Науки. Новые модели поведения исследователей. Новый механизм глобальной научной кооперации.

А. С. Колосов, А. А. Андреев (ПетрГУ).
«Совместная модель физического канального и сетевого уровней ИКТ – инфраструктуры локального поставщика сетевых услуг».

Аннотация доклада.

Решение многих задач сетевого управления требует наличия графа физической и логической структур сети. Автоматизированное построение такого графа осложнено разнородностью данных о структурах сети и их возможной неполнотой. При разработке методов построения графа использование графовой модели структур сети позволяет абстрагироваться от конкретных типов оборудования и реализаций сетевых технологий, использовать математический аппарат, предлагаемый моделью, и порождать графы конкретных структур реальных сетей.

В докладе предлагается графовая модель структур сети на физическом, канальном и сетевом уровнях с отражением виртуальных локальных сетей и IP-подсетей. В докладе также приводится и доказывается ряд свойств модели, облегчающих разработку алгоритмов построения графа структур Сети.

И. Ю. Иванов (Воронежский государственный университет).
«Продукционно-логические уравнения в LP-структуре нулевого порядка и их приложения в задачах обратного логического вывода».

Аннотация доклада.

Математические решётки дают естественную и эффективную алгебраическую модель представления знаний. Так решётка, на которой задано дополнительное бинарное отношение, соответствующее множеству правил (LP-структура), может применяться для исследования и оптимизации продукционно-логических систем, широко распространённых в информатике.

В докладе рассматриваются LP-структуры нулевого порядка, в основе которых лежит булева решётка. Такие алгебраические структуры могут использоваться для моделирования логических систем, семантика которых содержит полный набор связок пропозиционального языка нулевого порядка. Вводится класс продукционно-логических уравнений в LP-структуре нулевого порядка, исследуются свойства уравнений введённого класса. Предлагается метод поиска решений таких уравнений. Показывается, каким образом введённые уравнения могут применяться для ускорения обратного логического вывода в плане минимизации запросов к внешним источникам информации. Обсуждается разработанная программная реализация предложенного метода поиска решений уравнений.