Аннотация:В учебном пособии излагаются основные понятия и результаты, относящиеся к математической теории обучения с подкреплением. Автор определяет понятие марковского процесса принятия решений (МППР), являющееся центральным понятием теории обучения с подкреплением, формулирует и доказывает основные свойства МППР, вводит понятие политики МППР и приводит алгоритм построения оптимальной политики для заданного МППР.