Данные категориальные (Categorical data) — это данные, качественно характеризующие исследуемый процесс или объект, не имеющие количественного выражения. В них каждая единица наблюдения назначается определенной группе или номинальной категории на основе некоторого качественного свойства.
Обычно представляют собой построчные значения из ограниченного набора категорий (например, названия городов, наименования товаров, имена сотрудников и клиентов и т.д.). В некоторых случаях могут использоваться и числа, кодирующие эти категории.
При обработке таких данных применяются только операции сравнения: «равно» и «не равно», производится их упорядочение, например, по алфавиту. Применение арифметических операций к категориальным данным некорректно, даже если они представлены числами.
[Чесалов А. Ю. Глоссариум по искусственному интеллекту: 2500 терминов/ А. Ю. Чесалов — «Издательские решения» 2022 г., 670 стр.]
Данные категориальные — данные, которые описываются небольшим числом дискретных категорий, например, пол респондента, мужской или женский, является категориальной переменной.
[Глоссарий распространенных терминов машинного обучения, статистики и науки о данных. (Электронный ресурс). Режим доступа: http:// analyticsvidhya. com›glossary-of-common-statistics-and-machine-learning-term /, свободный.]