Я определенно рекомендую Weka , которая является открытым программным обеспечением для интеллектуального анализа данных , написанным на Java:
Weka - это набор алгоритмов машинного обучения для задач интеллектуального анализа данных. Алгоритмы могут быть применены непосредственно к набору данных или вызваны из вашего собственного кода Java. Weka содержит инструменты для предварительной обработки данных, классификации, регрессии, кластеризации, правил ассоциации и визуализации. Он также хорошо подходит для разработки новых схем машинного обучения.
Как упоминалось выше, он поставляется с кучей различных классификаторов, таких как SVM , Winnow , C4.5 , Наивный байесовский (конечно) и многие другие. подробнее (см. API документ ).
Обратите внимание, что многие классификаторы, как известно, имеют намного лучшую производительность, чем Наивный Байес в области обнаружения спама или классификации текста.
Кроме того, Weka предлагает вам очень мощный графический интерфейс …