как предсказать кластер для нового документа без использования Tfidfvectorizer - PullRequest
0 голосов
/ 16 июня 2020

Объяснение :

У меня есть набор данных DailyKos, который содержит слова (как функции) и их частоту. Я применил TfIdTransformer для вычисления оценок tf-idf и использовал кластеры = 7

Проблема :

  1. после нахождения кластеров я хочу найти важные функции, которые способствовал формированию кластера.
  2. Существует документ (содержащий несколько предложений), позволяющий предсказать, к какому кластеру он будет принадлежать. Как мне рассчитать оценку tf-idf, если я не могу использовать tfidfvectorzier?
...