Как бороться с шумом в текстовой классификации - PullRequest
0 голосов
/ 25 апреля 2020

У меня есть задача классификации текста, где, учитывая список документов и слов в документах, я должен классифицировать их по темам, к которым они принадлежат. Однако большая часть документов ниже ни к одной из тем. Как мне с этим бороться? Есть ли способ решить / очистить это в предварительной обработке или есть конкретные модели для реализации, которые являются стойкими к шуму. Я использую python для этой задачи.

...