В коде, который у вас уже есть, достаточно для этого. То, что у вас есть, - это лямбда (матрица слов-тем), а вы хотите вычислить гамму (матрица тем документов).
Все, что вам нужно сделать, это позвонить OnlineLDA.do_e_step
на документы, результаты - векторы тем. Производительность можно улучшить, убрав из нее sstats
, поскольку они нужны только для обновления лямбды. Результатом будет функция, которая выводит только тематические векторы для модели.
Вам не нужно обновлять модель, поскольку вы не обучаете ее, что и делает update_lambda
после вызова do_e_step
.