План работы семинара: 2017-2018 учебный год, осенний семестр

Д.Ю.Максимов (ИПУ РАН).
«Автоматизация выбора решения с помощью многозначной логики в задачах управления».

Аннотация доклада.

В докладе исследуется актуальная и ранее не рассматривавшаяся задача управления структурной динамикой сложных систем, которая обусловлена только структурными особенностями системы. А именно, исследуется одношаговая динамика структур задач логико-управляемой сложной системы и ее организационной структуры. Это распределенные и сетевые самоадаптирующиеся системы многорежимного управления (многофункциональные), в которых для управления используется предложенная формальная модель многозначной логики Н.А. Васильева. Впервые предложена категорная семантика для этой логики. В таких системах исследуются способы выбора варианта изменения структуры при возникновении перед системой новой задачи и оценка таких вариантов. Выбор решения в соответствии с этой оценкой может объяснять черты интеллектуального поведения природных аналогов таких систем (колоний насекомых).

А.П.Антонов, М.Г.Акимов (МГУ имени М.В. Ломоносова, Институт биоорганической химии им. акад. М.М.Шемякина и Ю.А.Овчинникова).
«Построение классификатора на основе системы анализа текстов».

Аннотация доклада.

Доклад посвящен задаче классификации пользователей системы "Истина" на основе анализа названий их статей.

Рассмотрены подходы с применением как онлайн-обучения на очень больших массивах данных (baseline решение) так и векторные представления документов (массивов слов) и их качественное сравнение. Будут затронуты некоторые вопросы обработки текстов. Актуальность задачи обуславливается, например, такими уникальными особенностями данных системы "Истина", такими как мультиязычность (названия статей на разных языках), наличие коллизий (у статьи могут быть различные авторы, что создает существенные проблемы при векторизации).

М.Г.Крейнес, Е.М.Крейнес, А.А.Афонин (ООО 'Базисные технологии').
«Технология КЛЮЧИ К ТЕКСТАМ® для поиска и анализа текстовой информации. Модели текстов и текстовых коллекций. Программная реализация технологии».

Аннотация доклада.

Информационная технология поиска и анализа текстовой информации КЛЮЧИ К ТЕКСТАМ® ориентирована на использование в сфере информационно-аналитического обеспечения научно-технической деятельности. С её помощью провайдерам и пользователям информационных ресурсов, лицам, принимающим управленческие решения и организаторам экспертизы, экспертам и авторам – ученым предоставляются востребованные сервисы:

  • по описанию тематики и содержания текстов и текстовых коллекций;
  • по содержательному поиску текстовой информации, в частности, по поиску содержательно близких текстов;
  • по оценке качества содержания текстов и текстовых коллекций.

Необходимое для информационного обеспечения разнообразных сфер деятельности использование масштабных текстовых коллекций полностью зависит от возможности технологического вычислительного (автоматического) решения задач поиска и анализа представленной текстами информации. Действительно, вручную можно перебрать и проанализировать сотню документов, однако, если речь идет о тысячах, десятках, сотнях тысяч, миллионах текстов – необходимы автоматические технологии. Иначе вы используете то, что не нужно, и не видите того, что нужно. Автоматические технологии основаны на вычислительных процедурах, позволяющих достаточно полно и правильно охарактеризовать тематику и содержание текста в целом. По существу, речь идет о вычислительно формируемых моделях текстов, содержательная интерпретация и использование которых не вызывает затруднений у пользователя.

В докладе рассмотрены оригинальные математические модели текстов и текстовых коллекций и их реализация в информационной технологии поиска и анализа текстовой информации КЛЮЧИ К ТЕКСТАМ®.

М.Г.Крейнес, Е.М.Крейнес, А.А.Афонин (ООО 'Базисные технологии').
«Технология КЛЮЧИ К ТЕКСТАМ® для поиска и анализа текстовой информации. Объективный анализ качества научных текстов и субъектов научной деятельности: показатели информативности и содержательной независимости научных текстов и данные наукометрии/библиометрии».

Аннотация доклада.

В докладе обсуждается задача сочетания содержательного анализа научных текстов с данными наукометрии и библиометрии, признанная одной из наиболее актуальных проблем в области оценки качества научных результатов. Методология и методы объективного анализа, оценивания и сопоставления конкретных научных результатов субъектов научной деятельности (отдельных ученых, коллективов, организаций, научных журналов, конференций, издателей научной литературы и т. п.) на настоящее время являются предметом научной и экспертной дискуссии, а также предметом научных исследований.

Широко тиражируемые библиометрические и наукометрические методы (на базе которых созданы и функционируют масштабные высокодоходные международные бизнес-проекты, например, Web of Science и Scopus) оказались подверженными манипулированию (со стороны бизнеса – публикации за деньги, и со стороны субъектов научной деятельности – содержательно необоснованное «дружественное» цитирование). Более того, они не имеют научного обоснования. Экспертные методы дорогостоящи, субъективны и также легко поддаются манипуляциям.

В докладе будут рассмотрены оригинальные математические модели количественных показателей, которые характеризуют качество научных текстов и разнообразные способы их использования, включая:

  • построение прямых оценок качества научных текстов и текстовых коллекций;
  • формирование референтных (адекватных для сопоставления) коллекций текстов;
  • выявление содержательно необоснованного цитирования;
  • использование референтных коллекций для анализа и сопоставления библиометрических и наукометрических данных.

Будут представлены примеры, наглядно демонстрирующие эффективность предложенных подходов:

  • оценивание конкретных научных текстов;
  • вычислительное выявление содержательно необоснованного цитирования;
  • выявления тематически близких научных журналов и сравнение их библиометрических/наукометрических показателей.

К.В.Лунев (МГУ имени М.В. Ломоносова).
«Автоматический сбор тезауруса семантически близких ключевых слов с использованием методов из теории графов и техник машинного обучения».

Аннотация доклада.

Многие современные информационные системы, такие как социальные сети, блоговое и поисковые системы, используют ключевые слова для описания содержащихся в них сущностей. Это значительно упрощает для пользователя поиск объектов системы, потому что позволяет с помощью запроса на естественном языке находить документы различной природы, включая текстовые документы, изображения, видеозаписи, т.е. любой объект, которому был приписан набор ключевых слов.

Важной задачей в области анализа ключевых слов является задача поиска семантически близких ключевых слов к заданному. Это позволяет улучшить качество ранжирования и поиска объектов информационных систем в целом.

В рамках данного доклада будут представлены методы определения близости пары слов по корпусу наборов ключевых слов с применением алгоритмов из теории графов. При помощи построенных графов будет продемонстрирован способ автоматической генерации обучающей выборки для классификации пар ключевых слов, семантически близких по смыслу. Будет показано, как по этой выборке и по построенным графам обучается модель машинного обучения, способная качественно решать поставленную задачу.

Кашницкий Ю.С. (Высшая школа экономики).
«Методы замкнутых описаний в задачах машинного обучения и обнаружения знаний».

Аннотация доклада.

В докладе будет представлен универсальный подход к классификации данных со сложной структурой на основе решеток замкнутых описаний. Предложенный алгоритм классификации на основе правил демонстрирует более высокое качество классификации, чем деревья решений. В докладе будет представлен комплекс программ для анализа данных со сложной структурой на основе решеток замкнутых описаний и для экспертного анализа классифицирующих правил.

С.А.Артамкин, Д.С.Карпенко, Д.А.Шачнев, Г.А.Богопольский, О.В.Глебова, Е.И.Заугольникова (МГУ имени М.В. Ломоносова).
«Перспективы развития подсистемы «Аспирантура» ИАС «ИСТИНА»».

Аннотация доклада.

В настоящее время в МГУ в рамках проекта развития ИАС «ИСТИНА» проводятся поисковые и прикладные исследования, направленные на создание механизмов, способствующих повышению эффективности процесса подготовки кадров высшей квалификации через аспирантуру. Деятельность на этом направлении потребовала от разработчиков сформировать новые, в соответствии с требованиями Федерального государственного образовательного стандарта (ФГОС), подходы к сбору и анализу данных, которые положены в основу электронного портфолио аспиранта. Особое внимание было уделено данным по научно - исследовательской деятельности (НИД) аспирантов (Блок 3 ФГОС).

Основная работа по вводу данных при таком подходе должна выполняться аспирантами в персональных профилях ИАС «ИСТИНА», а также в специально разработанных для этих целей личных кабинетах аспирантов. Для этого, в рамках подсистемы «Аспирантура» была проведена работа по интеграции данных уже существующей учетной системы АИС «Аспирант» с данными в системе подготовки принятия управленческих решений ИАС «ИСТИНА».

В докладе рассматриваются направления дальнейшего развития подсистемы.

  1. Создание программных механизмов, позволяющих планировать и эффективно контролировать процесс прохождения аспирантом траектории НИД, которая формируется на кафедре научным руководителем и аспирантом. В частности, объектами контроля должны быть объемы, своевременность и качество научно исследовательской деятельности аспиранта при подготовке материалов к аттестации.
  2. Переход к управлению процессом подготовки кадров через аспирантуру, основанном на формировании и анализе модели (онтологии) предметной области на различных этапах научно исследовательской деятельности каждого из аспирантов.

В.А.Роганов (МГУ имени М.В. Ломоносова).
«Программируемая математика как третий вид грамотности».

Аннотация доклада.

По аналогии с конструктивной можно ввести "программируемую математику", в которой объекты могут быть эффективно отображены в эффективные программы. Мы называем такие объекты прообразами программ, или пропрограммами. Используя накопленные за многие века математические подходы и методы, при помощи понятия обобщенной факторизации можно строить так называемые компетентные базы знаний, несущие "индуцированный интеллект" в мир программ. Знания в таких системах могут строиться динамически из так называемых "зерен", или прообразов знаний, что сильно упрощает реализацию искусственного интеллекта. Появление новых знаний ярко проявляется и в одном из видов пропрограмм. Обобщенная факторизация естественно приводит к численно-аналитическим методам, эффективным при оптимизации различных конструкций. Для электроники интерес могут представлять нововведения: компотроника и компограммы, а для цифровой экономики -- оптимизация управления многоагентными системами.

21 ноября 2017 года [планируемое заседание]
А.Афанасьева, С.А. Афонин (МГУ имени М.В. Ломоносова).
«Автоматическое распознавание данных о движении глаз на видеозаписи статической сцены».

Аннотация доклада.

Требуется максимально точно найти в видеофайле позицию шахматной доски и понять, на какое поле был направлен взгляд человека. Возможно, что это применимо не только к распознаванию шахматной доски, но и к другим задачам анализа движения глаз. Конечной целью её решения является: провести эксперименты с реальными шахматистами и сравнить их траектории движения глаз с теми траекториями, которые просматриваются программой (делает ли программа что-то похожее на действия человека). Записи делаются с частотой 50 кадров в секунду и хочется автоматизировать процесс их обработки. Отсюда и появляется задача обработки видео.

28 ноября 2017 года [планируемое заседание]
А.Н.Зорин (Воронежский государственный университет).
«Нечеткие LP-структуры и возможности их приложения в интеллектуальных системах».

Аннотация доклада.

Теория LP-структур предоставляет эффективный аппарат для исследования процессов управления знаниями и оптимизации логического вывода в различных разделах информатики. Стратегия релевантного обратного LP-вывода направлена на минимизацию числа обращений к внешним источникам информации. Исследования и эксперименты показывают, что при использовании данного подхода, по сравнению с обычным обратным выводом, снижение числа внешних запросов составляет в среднем 15–20%.

В докладе рассматривается новый класс алгебраических систем – нечёткие LP-структуры. Вводится основанный на этих структурах метод релевантного обратного вывода – стохастический нечёткий LP-вывод. Исследуются возможности его эффективной реализации и особенности вычисления весовых коэффициентов. Рассматриваются связанные вопросы вычислительной сложности. Представляется прототип основанной на стохастическом нечётком LP-выводе экспертной системы, выполняющей классификацию объектов по неполному и минимизированному нечёткому признаковому описанию. Исследуется способ генерации нечёткого бинарного отношения по модели базового классификатора. Обсуждается архитектура системы машинного обучения, использующая представленный подход для формирования целевой аудитории в таргетинговой рекламе.

5 декабря 2017 года [планируемое заседание]
С.А.Марченко (Петрозаводский государственный университет).
«Разработка сервисно-ориентированной информационной системы в виде интеллектуального пространства с приложением к задаче совместной деятельности людей».

Аннотация доклада.

Развернутое в условиях повсеместных вычислительных сред Интернета физических устройств с применением технологий Семантического Веба интеллектуальное пространство позволяет соединить физический и виртуальный (информационный) миры, организуя построение и доставку сервисов. В докладе представлены способы программной разработки сервисов, когда информационная система реализуется в виде интеллектуального пространства на имеющихся вычислительных устройствах среды. На основе архитектуры M3 для интеллектуальных пространств уточняется понятие сервиса, приводится классификация сервисов и определяются роли программных агентов, участвующих в их построении. Предлагается онтологическая модель сервиса для интеллектуального пространства. На примере задачи совместной деятельности людей предлагаются шаблоны взаимодействия агентов для выполнения построения и доставки сервисов. В частности, рассмотрен способ разработки сервиса анализа активности людей-участников в помещении. Показываются возможности использования предложенных решений для автоматизации программирования сервисов на основе генерации кода по онтологии сервиса.

12 декабря 2017 года [планируемое заседание]
Д.С.Хлебородов (МГУ имени М.В. Ломоносова).
«Архитектура кибербезопасности крупных предприятий».

Аннотация доклада.

В докладе в кратком изложении будут представлены результаты исследований автора, направленных на анализ и систематизацию отдельных механизмов, сервисов и систем, которые обеспечивают кибербезопасность крупных предприятий. Предлагается описать архитектурные особенности:

  • сервисов сетевой безопасности, ключевых сервисов информационно-технологической инфраструктуры, сервисов, обеспечивающих безопасность конечных рабочих станций, сервисов и личных мобильных устройств;
  • систем мониторинга и реагирования на инциденты, систем управления кибербезопасностью.