Запуск TF-IDF на модели Bigram - PullRequest
0 голосов
/ 03 июня 2019

Я хотел бы запустить модель LDA для извлечения тем. Для этого я хочу сначала создать биграммы, а затем создать модель TF-IDF в качестве входных данных для модели.

Пока что мне удалось запустить модель LDA с биграммами и модель с TF-IDF. Тем не менее, я не получаю его для работы с моделью биграммы в качестве входных данных для модели TF-IDF.

Я пробовал следующее:

bigram = gensim.models.Phrases(data_words_nostops, min_count=5, threshold=0.5, scoring = 'npmi')
bigram_mod = gensim.models.phrases.Phraser(bigram)
tfidf = models.TfidfModel(bigram_mod)

Первые две строки работают хорошо. Однако, когда я запускаю последнюю строку, я получаю следующее сообщение об ошибке:

TypeError: 'int' object is not iterable

Я нашел ссылку ниже, но я не понимаю, как я могу включить их ответ на мою проблему.

Python - TypeError: объект 'int' не повторяется

Что я могу сделать, чтобы запустить модель, которая включает в себя как биграммы, так и TF-IDF?

...