Алгоритмы обучения с подкреплением — тип машинного обучения, при котором машины «обучаются» достижению своей целевой функции в процессе экспериментов и вознаграждения. При обучении с подкреплением машина получает положительное подкрепление, когда его процессы приводят к желаемому результату, и отрицательное подкрепление, когда этого не происходит.
[Популярные термины искусственного интеллекта.(Электронный ресурс). Режим доступа: http:///skine.ru›Публикации›465570, свободный.]