Данные категориальные (Categorical data) — это данные, качественно характеризующие исследуемый процесс или объект, не имеющие количественного выражения. В них каждая единица наблюдения назначается определенной группе или номинальной категории на основе некоторого качественного свойства.
Обычно представляют собой построчные значения из ограниченного набора категорий (например, названия городов, наименования товаров, имена сотрудников и клиентов и т.д.). В некоторых случаях могут использоваться и числа, кодирующие эти категории.
При обработке таких данных применяются только операции сравнения: «равно» и «не равно», производится их упорядочение, например, по алфавиту. Применение арифметических операций к категориальным данным некорректно, даже если они представлены числами.
[Чесалов А. Ю. Глоссариум по искусственному интеллекту: 2500 терминов/ А. Ю. Чесалов — «Издательские решения» 2022 г., 670 стр.]