Объяснение :
У меня есть набор данных DailyKos, который содержит слова (как функции) и их частоту. Я применил TfIdTransformer для вычисления оценок tf-idf и использовал кластеры = 7
Проблема :
- после нахождения кластеров я хочу найти важные функции, которые способствовал формированию кластера.
- Существует документ (содержащий несколько предложений), позволяющий предсказать, к какому кластеру он будет принадлежать. Как мне рассчитать оценку tf-idf, если я не могу использовать tfidfvectorzier?