Мне нужна библиотека для наивного байесовского масштаба, с миллионами обучающих примеров и + 100k бинарных функций.Это должна быть онлайн-версия (обновляемая после тренировки).Мне также нужен вывод top-k, то есть несколько классификаций для одного экземпляра.Точность не очень важна.
Цель - приложение автоматической категоризации текста.
Любые предложения по созданию хорошей библиотеки очень приветствуются.
РЕДАКТИРОВАТЬ: Библиотека предпочтительно должна бытьна Java.