Переобучение — происходит, когда модель слишком сложна и слишком хорошо соответствует обучающим данным, что приводит к снижению производительности на новых, невидимых данных. Пример. Переобучение может происходить в нейронных сетях, деревьях решений и регрессионных моделях.
[50 терминов искусственного интеллекта. (Электронный ресурс). Режим доступа: http:// ru›articles/704343/, свободный]
Переобучение — это ситуация, когда модель слишком точно подгоняет свои предсказания под обучающие данные, теряя способность обобщать на новые данные. Это может привести к плохой производительности модели на тестовых данных.
[50 терминов для инженера машинного обучения. (Электронный ресурс). Режим доступа: http:// Pro-DGTL.ru›blog/razrabotka/tpost/4e93vbs2p1-50-/, свободный.]
Переобучение – свойство натренированного алгоритма на объектах тренировочной выборки давать существенно меньшую вероятность ошибки, чем на объектах тестовой.
[Воронина, В. В. Теория и практика машинного обучения: учебное пособие / В. В. Воронина, А. В. Михеев, Н. Г. Ярушкина, К. В. Святов. – Ульяновск: УлГТУ, 2017. – 290 с.]
Переобучение (overfitting) — <машинное обучение> создание модели, с наибольшей точностью соответствующей обучающим данным и не способной к обобщению при использовании новых наборов данных.
Примечание 1 — Переобучение может возникнуть, если обученная модель извлекла уроки из несущественных признаков обучающих данных (т.е. признаков, обобщение которых не приводят к полезным результатам), обучающие данные содержат много шума (например, имеют чрезмерное количество выбросов) или обученная модель чрезмерно сложна для определенных обучающих данных.
Примечание 2 — Признаком переобучения модели является значительная разница между ошибками, измеренными на обучающих данных и на отдельных тестовых и валидационных данных. На производительность переобученных моделей особенно влияет значительная разница между обучающими и эксплуатационными данными.
[ПНСТ 838-2023/ИСО/МЭК 23053:2022. Искусственный интеллект. Структура описания систем искусственного интеллекта, использующих машинное обучение]