Да, вы можете рассматривать вывод LDA как функции для ваших документов; это именно то, что Блей, Нг и Джордан сделали в статье , в которой был представлен LDA . Они сделали это для классификации, но для кластеризации процедура та же самая.
(В терминологии машинного обучения такое использование LDA называется уменьшение размерности , потому что оно уменьшает число пространств признаков с | V |, размером словаря, до некоторого числа k тем, выбранных пользователем.)