Инструмент для классификации текста - PullRequest
2 голосов
/ 10 апреля 2011

Я заинтересован в изучении классификации текста, поэтому изучаю теорию.Следующий шаг - делать вещи, и поэтому я ищу и использую различные инструменты.Некоторые ссылки указывают на WEKA , однако Mallet кажется более подходящим для этой задачи, но никто не ссылается на этот инструмент.Есть ли какая-то причина держаться подальше от Маллета, если он хочет работать над «серьезным» проектом?Я смог быстро обучить некоторые классификаторы с помощью Mallet и протестировать их, в то время как с WEKA я столкнулся с проблемой исчезновения моих ярлыков после использования фильтров для преобразования моих текстовых файлов в карты, названные с категорией текстов в нем.

1 Ответ

0 голосов
/ 17 апреля 2011

Это зависит от задачи, которую вы выполняете. Маллет также является популярным инструментом, и у Weka, и у Маллета есть свои плюсы и минусы. Для тривиальных задач оба просты в использовании. Я обычно предпочитаю Weka для задач кластеризации и классификации.

Примечание: не вводите в заблуждение популярность Weka в сообщениях на форуме, это связано главным образом с тем, что он используется в течение более длительного периода времени, а Маллет является новым по сравнению с Weka.

...