Вознаграждение (Reward) в обучении с подкреплением – это числовой результат выполнения действия в состоянии, определяемом окружающей средой.
[Чесалов А. Ю. Глоссариум по искусственному интеллекту: 2500 терминов/ А. Ю. Чесалов — «Издательские решения» 2022 г., 670 стр.]