Вы можете запустить то, что Brody & Elhadad (2010) называет local-LDA - просто подавать текстовые данные в предложение LDA по предложению - легко, если вы разбиваете свои документы на предложения. Тем не менее, LDA все равно даст вам более одной темы в предложении (по определению вы получаете значения для всех тем, хотя gensim имеет значение по умолчанию minimum_probabiliy
0,01), что, конечно, не совпадает с подходом, предложенным Bao & Датт.
Тем не менее, дополнительный материал к статье Bao & Datta (2014) содержит C или C ++ (я полагаю, это не сказано в readme) .exe
плюс инструкции по использованию в материалы. Вы можете просто запустить это из командной строки или написать обертку для Python (чтобы вывод в формате gensim был обледенелым) - если вы это сделаете, поделитесь кодом, это может быть полезно для других.