Архив: 2015-2016, осенний семестр — Научный семинар «Проблемы современных информационно-вычислительных систем»

Архив выступлений: 2015-2016 учебный год, осенний семестр

22 сентября 2015 года

А. А. Артемов (ВМК МГУ).

«Математическое моделирование процесса изменения содержания информационного пространства социума».

Аннотация доклада.

В докладе предлагается подход к моделированию процесса изменения содержания информационного пространства (ИП) социума с учетом силы информационного воздействия на его структурные элементы.

Современная система массовых коммуникации социума, рассматривается автором, как сложно-структурированная – социально-телекоммуникационная система (СТС), где социальные группы людей интегрированы с телекоммуникационными системами в многоканальной коммуникационной парадигме. Автор выдвигает гипотезу, что информационное пространство современного общества, может быть описано динамикой содержания информационных сообщений, распространяемых с использованием средств массовой коммуникации.

Задача, по определению минимальных структурных элементов содержания информационного сообщения, единиц их измерения и оценки в данных единицах количественных и качественных характеристик информационного пространства, решается автором благодаря синтезу методов когнитивной лингвистики на базе n-gramm (Харрис, Гензер, Чарняк), подходов культурной эволюции – меметики (Докинз, Броди, Блэкмор), вероятностной моделью языка (Налимов), теории информационного противоборства (Расторгуев) и теории системно-когнитивного анализа (Луценко).

В качестве направления для дальнейших исследовании, автор предлагает подходы: к оценке силы информационного воздействия на единичные элементы ИП СТС, определяемую через вероятность нахождения (появление или гибель) мема в информационном пространстве; к прогнозированию содержания информационного пространства, с учетом уровня системности/эмерджетности моделей знаний (мемплексов). Кроме теоретического материала, автором представлены результаты анализа информационного пространства русскоязычного сегмента ИП СТС (3000 публикаций за июль–август 2014 года), полученные с использованием предлагаемого им подхода. Результат анализа содержит расчеты вероятностей, агрессивности и силы воздействия для ТОП 30 из 600 выявленных мемов в русскоязычном сегменте ИП СТС.

29 сентября 2015 года

К. В. Лунев (Мехмат МГУ, НИИ механики МГУ).

«Методы построения иерархических классификаторов научных направлений и алгоритмы автоматической кластеризации научных сотрудников и научных коллективов на основе анализа контекстной информации».

Аннотация доклада.

Существующие вручную составленные классификаторы научных направлений имеют ряд недостатков:

существующие классы имеют абстрактный смысл и нуждаются в конкретизации;
системы являются статическими и не отражают изменения тенденций в научной среде;
вследствие трудоемкости разработки таких систем, классификаторы стремятся покрыть всю область научных направлений, что затрудняет применение таких классификаторов общего назначения в более специализированных задачах.

В работе рассматриваются подходы к решению задачи автоматического построения иерархических классификаторов научных направлений. В дополнение приводятся алгоритмы поиска экспертов, наиболее релевантных поисковому запросу, и методы кластеризации сотрудников по заданным критериям.

Основным источником информации при решении данных задач являются наборы ключевых слов, ассоциированные с конкретными статьями, сотрудниками и группами.

Кроме того используются дополнительные знания об объектах системы: соавторства, годы публикаций, аннотации и тексты статей, составы коллективов, научные интересы сотрудников и другие.

Решению задачи способствуют разработанные алгоритмы определения близости между ключевыми словами, а также между наборами ключевых слов.

6 октября 2015 года

А. М. Шестов (Мехмат МГУ).

«Многомасштабное описание трехмерной структуры молекулярного графа для решения задачи «структура-свойство»».

Аннотация доклада.

Одной из ключевых задач прикладной математики в химии является задача поиска количественных соотношений «структура–свойство», которая состоит в поиске численной зависимости между структурой молекулы химического соединения и её физико-химическими свойствами или биологической активностью. С точки зрения математики задача является частным случаем задачи распознавания образов. Задачу можно условно разделить на две части - построение математического описания структуры молекул и решение задачи классификации/регрессии для полученного описания. В данном докладе рассматривается новый метод описания структуры молекул. Основу метода составляет нахождение структурных элементов на молекулярной поверхности, которые соответствуют областям однородных физико-химических и геометрических свойств. В докладе будут описаны метод, детали реализации, вычислительная сложность, показатели качества на тестовых выборках и сравнение качества с аналогами.

13 октября 2015 года

С. А. Артамкин, Г. А. Богопольский, О. В. Глебова, Д. С. Карпенко (РНИМУ им. Н. И. Пирогова).

«Проект информатизации учебного процесса вуза (на примере РНИМУ), ориентация на решение ключевых задач вуза».

Аннотация доклада.

Решения для вузов, объединяющего в единый комплекс основные бизнес-процессы, в настоящий момент не существует. Это вынуждает ИТ коллективы заниматься интеграцией отдельных решений различных производителей (электронный деканат, E-Learning, электронный документооборот, электронная библиотека, СКУД и пр.). По этому пути шел и РНИМУ им. Н.И. Пирогова.

Разработанные в разное время, на разных платформах, находящиеся на разных стадиях жизненного цикла программные решения, потребовали значительных затрат, но не позволили создать единую информационно-образовательную среду Университета.

Отталкиваясь от полученного опыта реализации ИТ-проектов (в том числе собственного), в 2013 году в РНИМУ сформулированы следующие основные цели и задачи информатизации учебного процесса:

построение единой системы управления знаниями вуза, с возможностью определения и сокращения разрыва знаний между выпускниками вуза и требованиями работодателей;
увеличение интенсивности учебного процесса, в том числе за счет увеличения внеаудиторной нагрузки учащихся.
обеспечение объективности аттестации учебных достижений учащихся, построение БРС;
обеспечение единой сквозной системы электронного документооборота, связанного с документированием, учетом и контролем образовательной деятельности.
повышение производительности труда основных участников учебного процесса, снижение рутинных, неинтеллектуальных видов деятельности.
повышение эффективности управления по всем направлениям образовательной деятельности вуза.

20 октября 2015 года

О. Н. Шорин (Российская национальная библиотека).

«Семантическая интеграция библиографических записей национальной электронной библиотеки».

Аннотация доклада.

В Министерстве культуры Российской Федерации предпринимаются попытки, направленные на реализацию нового этапа развития Национальной электронной библиотеки (НЭБ). Основной целью этого этапа является обеспечение свободного, равного и всеобщего доступа граждан нашей страны к документной информации историко-культурного, научного и образовательного назначения через сеть Интернет, предоставляемой на основе единой общенациональной системы создания и эффективного использования цифровых библиотечно-информационных ресурсов и сервисов.

Следуя парадигме открытости данных, была осуществлена публикация библиографических записей библиотек, входящих в состав НЭБ, в соответствии с принципами Linked Open Data. Реализация данного проекта позволила получить доступ к библиографической информации, хранящейся в ряде крупнейших библиотек России, в виде, пригодном для машинной обработки. Набор данных состоит из нескольких десятков миллионов записей. Наличие открытого доступа к одному из самых крупных в мире массиву библиографической информации с возможностью обнаружения семантически связанных данных является одной из составляющих развития как культуры в целом, так и отдельных направлений книжной отрасли в частности.

В процессе семантической интеграции были решены несколько актуальных задач: разработана онтология предметной области, произведена конвертация библиографических данных из различных MARC-форматов в RDF, создан эффективный алгоритм поиска нечетких дубликатов среди большого количества записей, осуществлена публикация данных и предоставлена SPARQL точка доступа к ним.

Для выявления дублетных библиографических записей используется функция из семейства locality-sensitive hashing c дополнительными оптимизациями. Выявленные таким образом записи сравниваются друг с другом с помощью меры Жаккара для принятия окончательного решения о дублетности и осуществления слияния нескольких записей в одну. Полученные библиографические записи семантически связывались с данными из Библиотеки конгресса США, Британской национальной библиотекой и DBPedia. Для каждого из источников был создан модуль, который осуществлял поиск по заданному выражению и возвращал найденные результаты. Для отсечения заведомо неподходящих кандидатов для установления связи owl:sameAs отдельные поля библиографических записей разбивались на множества биграмм. Используя меру Жаккара, вычислялось расстояние между строками библиографических записей. Для тех пар записей, у которых мера превышала установленный порог, производилось связывание.

Основными научными и практическими результатами являются:

аналитическая модель построения модульных систем для сбора и последующей обработки библиографических записей;
алгоритм выявления дублетных библиографических записей и создания на их основе обогащенных данных, позволяющий минимизировать количество попарно сравниваемых записей;
разработанный набор XSLT-шаблонов для преобразования библиографических записей из различных форматов в формат, пригодный для публикации в LOD, в соответствии с существующей онтологией;
алгоритм связывания библиографических данных с уже опубликованными в LOD сведениями, поставляемыми различными организациями;
модульная система интеграции библиографических данных, позволяющая в автоматическом режиме осуществлять сбор библиографических записей из библиотек, проводить обогащение данных на основе полученной информации, конвертировать сведения в формат, пригодный для публикации в LOD, и устанавливать связи с уже опубликованными в LOD данными.

(PPTX, 0.3MB)

27 октября 2015 года

М. Д. Дзабраев, В. А. Роганов (Мехмат МГУ, НИИ механики МГУ).

«Экспресс-анализ текстовых данных на предмет вхождения в них ключевых слов и фраз».

Аннотация доклада.

Средства анализа текстовых данных представляют собой важный инструментарий для мониторинга как Интернет-пространства, так и трафика частных сетей, внося все более заметный вклад в обеспечение информационной безопасности.

Рассматривается задача быстрого обнаружения ключевых слов и фраз в потоках текстовых данных. Ключевым моментом при решении этой задачи является производительность программы-анализатора, которая должна обеспечивать обработку интенсивных потоков в режиме реального времени. Рассматриваются как классические алгоритмы для проведения такого анализа, так и их модификации, перспективные с точки зрения реализации на современных многоядерных платформах и спецвычислителях.

Презентация (PDF, 5.2MB)

3 ноября 2015 года

В. Ю. Бухонов (Мехмат МГУ).

«Обработка персональных данных в ИАС «Наука-МГУ» («ИСТИНА»)».

Аннотация доклада.

Доклад посвящён вопросам обработки персональных данных в ИАС «Наука-МГУ» («ИСТИНА»). Особое внимание будет уделено вопросам, связанным с анализом нормативных документов, в докладе показаны их связь и приложение к системе. Будут рассмотрены различные типы угроз, связанные с обработкой персональных данных, основные модели нарушителя, представлен краткий анализ их отношения к системе ИСТИНА. По результатам такого анализа определяется её соответствие одному из уровней защищённости в соответствии с принятыми в РФ нормативными документами.

10 ноября 2015 года

С. Г. Елизаров (Физический факультет МГУ).

«Специализированные многопотоковые процессоры с аппаратной поддержкой общей памяти с дополнительными признаками данных».

Аннотация доклада.

В докладе рассматривается архитектура и реализация на ПЛИС специализированных многоядерных (содержащих сотни и/или тысячи предельно простых вычислительных ядер) процессоров с разрешением конфликтов одновременного доступа к данным на уровне контроллера общей памяти и аппаратными механизмами планирования и исполнения легких потоков.

17 ноября 2015 года

С. И. Паринов (ЦЭМИ РАН).

«Научные информационные системы и модернизация научного процесса».

Аннотация доклада.

Система Соционет (https://socionet.ru) как пример современной научной информационной системы. Подсистема "информационный хаб". Формирование научного информационного пространства. Интероперабельность. Новые возможности для авторов публикаций. Новые возможности исследовательских организаций. Открытые репозитории организаций. Оценка научной результативности ученых и организаций. Поддержка принципов Открытой Науки. Новые модели поведения исследователей. Новый механизм глобальной научной кооперации.

(PPTX, 1.0MB)

24 ноября 2015 года

А. С. Колосов, А. А. Андреев (ПетрГУ).

«Совместная модель физического канального и сетевого уровней ИКТ – инфраструктуры локального поставщика сетевых услуг».

Аннотация доклада.

Решение многих задач сетевого управления требует наличия графа физической и логической структур сети. Автоматизированное построение такого графа осложнено разнородностью данных о структурах сети и их возможной неполнотой. При разработке методов построения графа использование графовой модели структур сети позволяет абстрагироваться от конкретных типов оборудования и реализаций сетевых технологий, использовать математический аппарат, предлагаемый моделью, и порождать графы конкретных структур реальных сетей.

В докладе предлагается графовая модель структур сети на физическом, канальном и сетевом уровнях с отражением виртуальных локальных сетей и IP-подсетей. В докладе также приводится и доказывается ряд свойств модели, облегчающих разработку алгоритмов построения графа структур Сети.

Презентация (PDF, 0.2MB)

1 декабря 2015 года

И. Ю. Иванов (Воронежский государственный университет).

«Продукционно-логические уравнения в LP-структуре нулевого порядка и их приложения в задачах обратного логического вывода».

Аннотация доклада.

Математические решётки дают естественную и эффективную алгебраическую модель представления знаний. Так решётка, на которой задано дополнительное бинарное отношение, соответствующее множеству правил (LP-структура), может применяться для исследования и оптимизации продукционно-логических систем, широко распространённых в информатике.

В докладе рассматриваются LP-структуры нулевого порядка, в основе которых лежит булева решётка. Такие алгебраические структуры могут использоваться для моделирования логических систем, семантика которых содержит полный набор связок пропозиционального языка нулевого порядка. Вводится класс продукционно-логических уравнений в LP-структуре нулевого порядка, исследуются свойства уравнений введённого класса. Предлагается метод поиска решений таких уравнений. Показывается, каким образом введённые уравнения могут применяться для ускорения обратного логического вывода в плане минимизации запросов к внешним источникам информации. Обсуждается разработанная программная реализация предложенного метода поиска решений уравнений.