Разработка принципов построения сверхмасштабируемых систем мониторинга программно-аппаратной среды суперкомпьютеровНИР

Источник финансирования НИР

грант РФФИ

Этапы НИР

# Сроки Название
1 1 января 2013 г.-31 декабря 2013 г. Разработка принципов построения сверхмасштабируемых систем мониторинга программно-аппаратной среды суперкомпьютеров
Результаты этапа: Разработаны принципы построения систем мониторинга, пригодных для выполнения всех задач, возникающих при анализе данных о состоянии программно-аппаратной среды суперкомпьютеров, в том числе тех, которые не могут быть решены при помощи существующих систем. Выделены принципиально важные особенности мониторинга суперкомпьютеров, учитывающие текущие особенности архитектуры и тенденции развития этой области. Сформулированы требования к системам мониторинга, следование которым позволит решать стоящие перед такими системами задачи. В соответствии с этими принципами разработана архитектура такой системы мониторинга, позволяющей гибко менять конфигурацию и настройку для решения всего спектра задач мониторинга. Начата реализация прототипа системы мониторинга в соответствии с разработанной архитектурой. Проведено тестирование прототипа на суперкомпьютере «Ломоносов», показавшее хорошую производительность и пригодность прототипа к работе на больших современных вычислительных системах.
2 1 января 2014 г.-31 декабря 2014 г. Разработка принципов построения сверхмасштабируемых систем мониторинга программно-аппаратной среды суперкомпьютеров
Результаты этапа: Исследованы методы распределения данных мониторинга между компонентами серверной части. На основе проведенного исследования предложен новый подход к мониторингу производительности потоков задач на суперкомпьютерах, предполагающий вычисление метрик производительности задач не лету, без промежуточного сохранения данных. Предложена архитектура построения масштабируемых систем мониторинга с распределенной серверной частью на основе создаваемого прототипа. Разрабатываемый прототип расширен для использования нескольких ядер процессора. Реализована функциональность, необходимая для активного режима мониторинга. Увеличен набор получаемых данных, включая разработку датчиков для получения информации о загрузке графических ускорителей. Проведено тестирование прототипа на суперкомпьютере «Ломоносов», а также исследована масштабируемость и накладные расходы компонент создаваемой системы. Проведенные исследования показали пригодность разрабатываемого прототипа для создания систем мониторинга существующих и перспективных суперкомпьютеров.
3 1 января 2015 г.-31 декабря 2015 г. Разработка принципов построения сверхмасштабируемых систем мониторинга программно-аппаратной среды суперкомпьютеров
Результаты этапа: Будет разработан и реализован механизм для получения метрик производительности всех задач выполняющихся на суперкомпьютере. Будет проведен анализ ресурсов, необходимых для анализа производительности больших потоков задач на реальных вычислительных системах. Будет проведен анализ масштабируемости предложенного решения.

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".