Модель мешка слов (Bag-of-words model) – это упрощающее представление, используемое при обработке естественного языка и поиске информации (IR). В этой модели текст (например, предложение или документ) представляется в виде набора (мультимножества) его слов без учета грамматики и даже порядка слов, но с сохранением множественности. Модель мешка слов также использовалась для компьютерного зрения. Модель мешка слов обычно используется в методах классификации документов, где (частота) появления каждого слова используется в качестве признака для обучения классификатора.
[Чесалов А. Ю. Глоссариум по искусственному интеллекту: 2500 терминов/ А. Ю. Чесалов — «Издательские решения» 2022 г., 670 стр.]