Классификация документов - PullRequest
       38

Классификация документов

0 голосов
/ 24 февраля 2011

Пожалуйста, предложите мне классификатор, который классифицирует документы на основе требований, указанных ниже.

У меня есть набор документов, которые необходимо классифицировать. Для каждой метки классификации у меня есть набор терминов, специфичных для этой метки класса.

Ответы [ 2 ]

0 голосов
/ 05 ноября 2014

Поскольку к документу прикреплены ярлыки, это относится к контролируемому обучению .Вы можете использовать любой из приведенных ниже классификаторов для достижения классификации документов.1. Наивный байесовский классификатор 2. Ближайший районный классификатор 3. Деревья решений 4. Метод подпространства

Большинство библиотек ml будут иметь реализации для вышеуказанных методов.Вы можете обратиться к этой ссылке, если хотите выбрать, какую библиотеку ml основать на языке программирования, с которым вам удобно работать.http://daoudclarke.github.io/machine%20learning%20in%20practice/2013/10/08/machine-learning-libraries/

0 голосов
/ 09 апреля 2011

Что ж, если у вас уже есть термины для ваших классов, вы можете использовать некоторые различные виды классификаторов, например, SVM , Наивный байесовский классификатор или даже NeuralСеть .

Существуют некоторые библиотеки, которые включают эти классификаторы, например weka или mahout .

Недавно я написал примеркак это сделать с помощью наивного байесовского классификатора: наивный байесовский пример , но это скорее объяснение концепции, а не реально используемый инструмент.

...