Что ж, я должен сказать, что классификация документов отличается от того, о чем вы, ребята, думаете.
Как правило, в классификации документов после предварительной обработки тестовые данные всегда чрезвычайно велики, например., O (N ^ 2) ... Поэтому это может быть слишком дорого в вычислительном отношении.
Другой типичный классификатор, который мне пришел в голову, - это дискриминантный классификатор ... которому не нужна порождающая модель для вашего набора данных,После тренировки вам нужно будет добавить свою единственную запись в алгоритм, и он будет засекречен.
Удачи с этим.Например, вы можете проверить книгу Э. Алпадина «Введение в машинное обучение».