Как классифицировать текст, который не относится к классам, которые я имею к «Неизвестным» в классификации текста? - PullRequest
0 голосов
/ 03 сентября 2018

Я работаю над проблемой НЛП, чтобы классифицировать текст на четыре класса. 1. Спорт 2. Развлечения 3. Астрология 4. Неизвестный

Я создал учебный набор данных для спорта, развлечений, астрологии. Но как создать обучающий набор данных для категории «Неизвестно» или как классифицировать текст, который не относится к первым трем категориям, к последней категории, т. Е. «Неизвестная категория»

1 Ответ

0 голосов
/ 05 сентября 2018

Я бы выбрал документы / тексты, которые не принадлежат ни к одному из первых 3 классов.

Здесь есть важный улов, вероятно, что количество документов будет очень большим по сравнению с количеством документов в каждом другом классе, поэтому, вероятно, вам нужно сделать выборку (например, случайным образом). выбирая количество документов), Unknown класс.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...