Разработка методов анализа характеристик масштабного банка задач в оперативной 7*24 практике суперкомпьютерных центровНИР

Analysis methods of large-scale job bank characteristics in operational 7*24 practice of supercomputer centers

Источник финансирования НИР

грант РФФИ

Этапы НИР

# Сроки Название
1 12 апреля 2017 г.-31 декабря 2017 г. Разработка методов анализа характеристик масштабного банка задач в оперативной 7*24 практике суперкомпьютерных центров
Результаты этапа: в 2017 году получены следующие результаты: 1) Выделен набор ключевых интегральных характеристик приложений, отражающих степень и характер использования вычислительных ресурсов: данные от системы мониторинга, данные от СУПЗ, отчеты о результатах глубокого анализа приложения, вспомогательные теги и др. 2) Разработаны базовые методы анализа истории выполнения приложений для всех категорий пользователей. 3) Определен необходимый формат хранения выделенных характеристик. 4) Разработана структура банка интегральных характеристик выполненных приложений. 5) Исследованы требования к web- инструменту, реализующему разработанные методы анализа. 6) Реализован базовый прототип web-инструментария, реализующий разработанные методы. 7) Исследованы и реализованы методы автоматизированного внесения данных по всем выполняющимся задачам пользователей СКЦ МГУ. Банк наполнен интегральными характеристиками на основании имеющихся данных системного мониторинга и логов СУПЗ. 8) Проведена интеграция с инструментом анализа эффективности отдельных приложений JobDigest. 9) Пользователям СКЦ предоставлен доступ к прототипу. 10) Текущие результаты по проекту представлены на одной российской и двух международных конференциях.
2 1 января 2018 г.-31 декабря 2018 г. Разработка методов анализа характеристик масштабного банка задач в оперативной 7*24 практике суперкомпьютерных центров
Результаты этапа: В рамках этапа проведен ряд взаимодополняющих работ. Проведено уточнение используемого набора характеристик и структуры банка приложений, по результатам опубликована статья и сделано секционное выступление на международной конференции ПаВТ. Проведен опрос пользователей и осуществлен анализ опыта использования разработанных методов анализа и инструментария реальными пользователями крупного СКЦ. По результатам опубликована статья в международном рецензируемом журнале. Разработанные методы анализа получили уточнение на основании опыта первого года применения методов пользователями. В том числе, проведена разработка методов расширенной визуализации для работы с интегральными характеристиками выполненных приложений. Прототип нового интерактивного инструмента доступен администраторам Центра, будет предоставлен пользователям в начале 2019 года к моменту начала ежегодной перерегистрации пользователей СКЦ МГУ. По результатам разработки подана статья на международную конференцию, идет рецензирование. Разработанный инструментарий - наиболее ценный из всего множества полученных результатов. на основании богатого опыта администрирования все основания полагать, что он будет применяться подавляющим большинством пользователей СКЦ. Представление полученных результатов работы на международных конференциях и в публикациях - международная наунчаня конференция ПаВТ (http://agora.guru.ru/pavt) - секционный доклад и публикация Scopus; - Всероссийский семинар по параллельным, распределенным и облачным вычислениям для молодых ученых Ural-PDC (https://ural-pdc.org/2018/) - пленарный доклад, статья принята к публикации (Scopus) - статья в международном журнале Supercomputing Frontiers and Innovations, Scopus
3 1 января 2019 г.-31 декабря 2019 г. Разработка методов анализа характеристик масштабного банка задач в оперативной 7*24 практике суперкомпьютерных центров
Результаты этапа: По состоянию на 12.12.19: Доработаны и расширены все разработанные методы. Ведется формирование законченной методики анализа истории выполнения программ для всех групп пользователей. Запущена полномасштабная версия инструментов анализа, досьупная пользователям в личном кабинете системы Octoshell. Проведена апробация и устранены полученные в ходе апробации замечания. Подготовленное тиражируемого решения для внедрения в практику ведущих СКЦ доступно на github вместе с исходным кодом системы Octoshell. Все полученные результаты представлены на конференциях: - ПаВТ (http://agora.guru.ru/pavt), - Russian Supercomputing Days (http://russianscdays.org) в 2019 году в рамках проекта опубликовано 3 работы (2 - Scopus, 1 - РИНЦ), еще одна работа (WebOfScience) принята к публикации.

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".