Архив выступлений: 2018-2019 учебный год, осенний семестр

Роганов В. А., Елизаров С. Г. (МГУ имени М.В. Ломоносова).
«Тестирование многоядерных вычислительных систем на основе идей алгоритма RSA».

Аннотация доклада.

В силу увеличения сложности вычислительных систем и создания сверхбольших специализированных систем (many-core системы) возрастает объем ошибок и уязвимостей на аппаратном и программном уровне. Выявление ошибок и уязвимостей, тестирование являются важной задачей на различных этапах создания вычислительных систем.

Традиционным подходом к тестированию many-core систем является запуск тестов на ЭВМ «A» с последующей проверкой результатов на заведомо исправной ЭВМ «В». Однако такой подход предполагает, что имеется «образцовая» ЭВМ с производительностью, сравнимой с производительностью тестируемой вычислительной системы. В случае создания больших вычислительных систем «образцовая» ЭВМ может попросту отсутствовать. Доказательство корректности работы на уровне математической модели устройства является сложной задачей для существующих методов формальной верификации.

Одним из решений вляется тестирование путём запуска программных тестов, обеспечивающих длительную распределенную загрузку системы с легко проверяемым результатом. Тесты должны удовлетворять следующим требованиям:

  • быть простыми в реализации, осуществлять сложные преобразования при вычислении и обеспечивать быструю проверку полученных результатов;

  • задействовать все основные подсистемы many-core систем, включая счётные ядра, память, коммуникационную среду;

  • масштабироваться и распараллеливаться;

  • иметь предсказуемое и легко варьируемое время выполнения;

  • иметь высокую чувствительность к одиночным сбоям: ошибки на любом этапе выполнения программы должны с высокой вероятностью отражаться на результате теста;

  • обеспечивать хорошее покрытие и псевдослучайное распределение получаемых значений;

  • иметь труднопредсказуемый заранее результат вычислений.

Предложена методика, выявляющая единичные сбои в работе аппаратуры. Методика основана на идее криптографических алгоритмов с открытым ключом, позволяет быстро проверять результаты тестирования и исключает возможность их фальсификации.