Я пытаюсь классифицировать текстовые данные на несколько категорий. Но в наборе данных могут быть данные, которые не принадлежат ни к одной из определенных категорий.
И после развертывания конечного продукта продукт должен иметь дело с текстовыми данными, которые не относятся к предопределенной категории.
Для реализации этого решения в настоящее время я использую текстовый классификатор SVM. И я планирую определить другую категорию как
"non"
для работы с данными, которые не относятся к предопределенным категориям.
Это правильный подход?