Согласно вашему объяснению, проблема, которую вы решаете, - это классификация по нескольким классам, а не классификация по нескольким меткам, основанная на ваших примерах.
Если каждая квитанция сопоставлена только с одной категорией из множества возможных категорий, то это классификация нескольких классов.
Если каждая квитанция может быть сопоставлена более чем одной категории из множества возможных категорий, то это классификация по нескольким меткам.
Более подробное описание и знать о доступных алгоритмах в sklearn для решения этих проблем смотрите здесь .
Для более простых шагов для работы с текстовыми данными, читайте здесь
РЕДАКТИРОВАТЬ:
У вас может быть отдельная модель для прогнозирования налоговой категории длякаждая квитанцияПоскольку построение нескольких мультиклассовых моделей относительно проще, чем создание одной мультибликовой модели