Терминологический словарь автоматизации строительства и производственных процессов

Свидетельство о регистрации СМИ:
ЭЛ № ФС77-79395 от 02.11.2020

ISSN: 2782-1528

DOI 10.34660/c0727-6092-6372-a

Последнее обновление словаря: 14.04.2024 - 20:34
Категории

Обучение с разницей во времени

Обучение с разницей во времени — класс безмодельного обучения с подкреплением, которое изучает начальная загрузка из текущей оценки функции ценности. Эти методы выбирают из среды, например методы Монте-Карло, и выполняют обновления на основе текущих оценок, например методы динамического программирования.

[Глоссарий искусственного интеллекта. (Электронный ресурс). Режим доступа: http:// hrwiki.ru›wiki/Glossary_of_artificial_intelligence/, свободный.]

41 просмотров

Правообладателям! В случае если свободный доступ к данному термину является нарушением авторских прав, составители готовы, по требованию правообладателя, убрать ссылку, либо сам термин (определение) с сайта. Для связи с администрацией воспользуйтесь формой обратной связи.