Обучение с подкреплением
Обучение с подкреплением (reinforcement learning) — машинное обучение, при котором используется функция вознаграждения для оптимизации функции поведения или функции общего подкрепления путем последовательного взаимодействия со