Аннотация:Магистерская диссертация посвящена разработке метода оценки времени выполнения нейронной сети свертки на графических процессорах (GPU).
Метод содержит этап настройки на конкретную модель GPU, когда необходим доступ к устройству для определения параметров аппроксимирующей функции. После этого оценка времени выполнения произвольной сверточной НС вычисляется без ее непосредственной реализации на целевом графическом процессоре.
Работа основана на использовании методов машинного обучения. При этом в отличие от ряда аналогичных существующих подходов оценки времени вычисления функции, нейронная сеть не рассматривается как «черный ящик». Информация о структуре сети активно используется – в методе предлагается декомпозиция полного времени вычисления НС на значения времени, требуемые для вычисления каждого слоя сети и передачу данных. Аппроксимация каждого из этих времен выполняется отдельно. Такой подход позволил локализовать наиболее затратные с точки зрения времени выполнения типы слоев и построить для них оценки времени с высокой точностью и тем самым существенно повысить точность оценки полного времени работы сети.