Я пытаюсь найти количество кластеров в наборе данных DBLP V11, используя область исследования.
Я пытался использовать doc2vec с предварительной подготовкой и усреднением по word2vec с предварительной подготовкой и кластеризовать результаты с использованием DBSCAN, иерархической кластеризации и получитьколичество кластеров с использованием метода колена, метода силуэта и статистики разрыва.
Я получаю один или два кластера из этого, потому что все статьи связаны с информатикой, но мне нужно выяснить количество подполей из информатики.