Я пытаюсь использовать моделирование Lens Gensim для топологии c модели набора данных пищевых рецептов. Я бы хотел sh иметь темы, основанные на ключевых ингредиентах в рецепте. Но текст рецепта содержит больше слов, которые являются родовыми c Engli sh и не являются названиями ингредиентов. Следовательно, мой топический результат не так хорош, как ожидалось. Я пытаюсь понять влияние частоты слов на результат LDA topi c. Спасибо.