Описание:Обучение с подкреплением (Reinforcement learning) - это методология, направленная на решение прикладных задач связанных с управлением сложными динамическими процессами. Эта методология синтезирует в себе теорию управления и теорию обучения (вероятностные подходы), что делает ее применимой к широкому кругу задач, в частности, к задачам, в которых отсутствует модель рассматриваемого процесса или модель настолько сложна, что не позволяет аналитического исследования. В рамках рассматриваемого курса будут рассмотрены основные методы обучение с подкреплением, их математическое обоснование и способы применения на практике.