Classification and regression trees — деревья классификации и регрессии. Алгоритм Classification and Regression Tree разработан Leo Bremen, Jerry Friedman, Charles Stone и Richard Olsen. Алгоритм строит бинарные деревья, имеющие двух потомков в каждом узле дерева. На каждом шаге построения дерева правило, формируемое в узле, делит заданную обучающую выборку на две части – часть, в которой выполняется правило (левый потомок) и часть, в которой правило не выполняется (правый потомок). Для выбора оптимального правила разбиения используется функция оценки качества разбиения. Функция оценки качества разбиения основана на идее уменьшения неопределенности в узле. Дерево решений с непрерывными выходными значениями называется деревом регрессии, деревья классификации выводят конкретные категориальные значения. В дереве имеется один особый узел, известный как корневой. Это основа дерева, от которой можно перейти по дереву к любому узлу. Ключевым моментом является иерархия разбиений. В результате последовательности проверок организуется процесс разбиения данных на непересекающиеся подмножества. Каждый листовой узел соответствует небольшой, но исключительной (неповторяющейся) части исходного множества.
[Глоссарий распространенных терминов машинного обучения, статистики и науки о данных. (Электронный ресурс). Режим доступа: http:// analyticsvidhya. com›glossary-of-common-statistics-and-machine-learning-term /, свободный.]