Я новичок в Doc2Vec, пожалуйста, ответьте на наивные вопросы.
Я сгенерировал оценку Doc2vector, т.е. с использованием алгоритма «Вектор абзаца».У меня есть выходной массив для каждого документа.
Я использую модель. Похоже на doc1 и получаю вывод - doc5 и doc10 похожи на doc1.
Q1) Как подвести итог, используя кодКакие важные слова или краткое описание высокого уровня содержится в этом документе?
Кроме того, если я использую вывод массива и запускаю K-means, чтобы получить 5 кластеров.Как определить определение кластера.
Q2) Я могу читать документы, но количество документов очень велико, и выполнить чтение вручную, чтобы найти определение кластера, невозможно.