Каков точный набор данных для классификации текста пакета tntsearch - PullRequest
0 голосов
/ 21 сентября 2018

Я нашел пакет для классификации текста в PHP, в котором метод для классификатора принимает предложение и категорию следующим образом:

$classifier->learn('that was a clean election', 'not sports');
$classifier->learn('that was a nice game','sports');

$classifier->guess('the game was bad');
// returns sports

Какой набор данных лучше всего подходит для этого подхода?А также у меня есть динамическая категория, что означает, что я могу добавить дополнительную категорию.Моя проблема в том, что я должен приводить примеры в каждой добавленной категории, что означает, что мне нужно больше данных в этой категории.

1 Ответ

0 голосов
/ 21 сентября 2018

Для этой цели существует множество наборов данных, в этой статье есть подробная информация о главных, я связал ее следующим образом:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...