Я использую MALLET панель инструментов "train-themes" над своими документами, когда количество тем равно 100.
Я получаю правильные (семантически правильные) темы, но я вижу черезФайл с состоянием раздела, в котором число тем для каждого документа достаточно велико (не имеет смысла, что в одном документе будет ~ 30 различных семантических тем).Документ из ~ 200 слов содержит ~ 30 тем.Кажется, что проблема как-то связана с альфа-параметром тем.
Есть предложения?