ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ЦЭМИ РАН |
||
Исследование и разработка методов глубокого обучения генерации выборок многомерных случайных векторов в пространствах с большим числом измерений, с учетом априорной детерминистской и вероятностной информации о генерируемых событиях и их выборках для моделирования сложных физических явлений на примере экспериментов в области наземной гамма- астрономии. Наземная гамма-астрономия изучает излучение гамма-квантов галактического и внегалактического происхождения с помощью специально разработанных установок, так называемых атмосферных черенковских гамма- телескопов (Imaging Atmospheric (or Air) Cherenkov Telescope, IACT). С помощью этого метода гамма-излучение регистрируется на земле оптически как черенковский свет, порождаемый обширными ливнями вторичных частиц, когда гамма-кванты очень высокой энергии попадают в атмосферу. Гамма-кванты таких энергий составляют лишь малую долю (меньше одной десяти тысячной) потока космических лучей, состоящего, в основном, из протонов. Для анализа данных, планирования эксперимента и других задач необходимо проводить моделирование, результатом которого должны стать сотни тысяч и миллионы событий, включая протонные события, являющиеся фоном. На разработку эффективных алгоритмов машинного обучения для генерации семплов и направлен предложенный проект. Решение данной проблемы является весьма важным для гамма-астрономии, поскольку благодаря отсутствию электрического заряда, гамма-кванты несут информацию об их сверхудаленных источниках, в которых происходят экзотические и экстремальные процессы во Вселенной. И
The scientific problem to be solved under the project is the research and development of deep machine learning methods for analyzing models of physical phenomena using samples of random states. Until recently, practically the only approach that allows one to numerically simulate very complex physical phenomena was the approach based on Monte Carlo methods. However, the use of realistic physical models based on the Monte Carlo method is very time and resource intensive. One of the alternative and very promising methods is the use of machine learning methods to generate samples of random vectors. A distinctive feature of modeling physical phenomena, especially in the physics of elementary particles and cosmic rays, is the need to reproduce the states of the system, taking into account the constraints determined by the nature of the physical phenomenon. Prior knowledge can take the form of logical rules, algebraic or differential equations (for example, conservation laws or equations of relationships between parameters or degrees of freedom that describe the phenomena under study), the presence of symmetries with respect to discrete or continuous groups of input/output data, as well as known beforehand probabilistic relationships among data. In the Monte Carlo methods, a prior knowledge is introduced at the level of the mathematical model. For machine learning methods, such constraints are difficult to reproduce. This is especially true for various statistical distributions over a set of states. These problems can be solved by additionally incorporating prior knowledge of such constraints into the learning process. This is the novelty of the proposed approach to solving the general problem, namely the efficient generation of samples of random states taking into account prior knowledge. Practical verification of the developed approaches will be carried out by applying them to analysis of models of physical phenomena in astroparticle physics. The specific task of this project within the framework of the general problem is to research and develop methods of deep learning for generating samples of multidimensional random vectors in spaces with a large number of dimensions, taking into account a prior deterministic and probabilistic information about generated events and their samples for modeling complex physical phenomena using the example of experiments in the field of terrestrial gamma-ray astronomy. Terrestrial gammaray astronomy studies the emission of gamma quanta of galactic and extragalactic origin using specially designed installations, the so-called atmospheric (or air) Cherenkov gamma telescopes (IACT). With this method, gamma rays are optically detected on the ground as Cherenkov light, generated by extensive showers of secondary particles when very high energy gamma rays enter the atmosphere. Gamma quanta of such energies make up only a small fraction (less than one tenthousandth) of the cosmic ray flux, which consists mainly of protons. For data analysis, experiment planning and other tasks, it is necessary to carry out simulations, the result of which should be hundreds of thousands and even millions of events, including proton events that are the background. The proposed project is aimed at developing effective machine learning algorithms for generating samples. The solution to this problem is very important for gamma astronomy, since due to the absence of an electric charge, gamma quanta carry information about their ultra-distant sources, in which exotic and extreme processes in the Universe take place. Integration of a prior, previously known knowledge into the learning process will significantly improve the quality of the obtained samples, and, consequently, the quality of event modeling, in particular, events of extensive air showers recorded by Cherenkov telescopes. The practical tasks of the project will be: research of existing and development of new methods of deep machine learning for generating random vectors taking into account prior informations; development of algorithms based on them and their software implementation; research, comparison, selection of the best methods; comparison with existing methods. During the implementation of the project, a full cycle of research and solutions of the assigned tasks will be carried out, from theoretical development of the approach to practical software implementation. In addition to the basic example from the field of astrophysical experiments, event generators based on deep machine learning methods will find important applications in other scientific and applied areas related to the analysis of complex and multidimensional probabilistic phenomena. For example, in the field of hydrodynamics for the study of processes associated with turbulence, in meteorology, in the study of the behavior of large groups of people or animals in critical circumstances, and others. Due to the explosive growth in the amount of various data that require analysis, including that based on existing and new methods of deep machine learning, the problem of generating samples of random states corresponding to prior knowledge, in the case of spaces with a large number of dimensions, is very relevant and important
Основными результатами данного проекта будут методы интеллектуального моделирования данных в астрофизических экспериментах на основе машинного обучения. К ним относятся методы быстрого моделирования событий регистрации широких атмосферных ливней черенковскими телескопами с использованием генеративных нейронных сетей. Их научная значимость состоит в том, что использование таких методов позволит заменить сложные и ресурсоемкие методы Монте-Карло, существенно ускорить процесс моделирования, что, в свою очередь, позволит существенно продвинуться в понимании фундаментальных процессов, происходящих во Вселенной. Разрабатываемые методы могут найти применение не только в научных исследованиях, но и в инженерных науках, в экономике, везде, где используются методы Монте-Карло для моделирования различных явлений и необходимо учитывать априорную информацию, присущую этим явлениям. Конкретно, в рамках проекта будут получены следующие основные результаты: - методы и алгоритмы на основе машинного обучения генерации случайных выборок многомерных векторов с учетом априорных ограничений, в том числе, статистических характеристик полученных наборов (семплов); - программная адаптация существующих и реализация новых методов и алгоритмов генерации случайных выборок; - результаты вычислительных экспериментов по сравнению Монте-Карло генераторов и генераторов основанных на машинном обучении с учетом априорной информации на примере моделирования событий в гамма-астрономии.
Предложенный проект посвящен, в основном, информационным технологиям, в частности одному из самых его бурно развивающихся разделов — интеллектуальным методам анализа больших данных. Однако, проект имеет также сильно выраженный междисциплинарный характер, а его результаты ориентированы на одну из самых передовых областей научных исследований — астрофизику субатомных частиц, которая занимается изучением самых глубинных основ строения Вселенной. Поэтому в коллективе участвуют специалисты в области как ИТ, так и физики высоких энергий, включая гамма-астрономию.
грант РНФ |
# | Сроки | Название |
1 | 1 января 2022 г.-31 декабря 2022 г. | Моделирование выборок случайных событий с учетом априорной информации в астрофизических экспериментах методами машинного обучения |
Результаты этапа: | ||
2 | 1 января 2023 г.-31 декабря 2023 г. | Моделирование выборок случайных событий с учетом априорной информации в астрофизических экспериментах методами машинного обучения |
Результаты этапа: |
Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".