Я успешно запустил mahout lda и отобразил результат с помощью команды mahout ldatopics.
Например, мои темы - наука и спорт.тогда результат будет таким: тема 0 баскетбол, игра, бейсбол тема 1 исследование, учеба, философия
Теперь у меня вопрос, как мне определить группу или группу отдельной статьи.Есть ли идентификационный номер или какой-то другой вид отслеживания, так что для каждой новой статьи, которую я добавляю, она будет сгруппирована или добавлена в определенный кластер / тему.
Если у меня уже есть кластер, каков следующий шаг?
Спасибо