Найти количество кластеров в наборе данных DBLP - PullRequest
0 голосов
/ 22 мая 2019

Я пытаюсь найти количество кластеров в наборе данных DBLP V11, используя область исследования.

Я пытался использовать doc2vec с предварительной подготовкой и усреднением по word2vec с предварительной подготовкой и кластеризовать результаты с использованием DBSCAN, иерархической кластеризации и получитьколичество кластеров с использованием метода колена, метода силуэта и статистики разрыва.

Я получаю один или два кластера из этого, потому что все статьи связаны с информатикой, но мне нужно выяснить количество подполей из информатики.

1 Ответ

0 голосов
/ 23 мая 2019

В таких данных нет «количества» кластеров.

Вместо этого многие ответы верны. Или нет.

Является ли машинное обучение частью искусственного интеллекта? Глубокое изучение - это отдельная тема? А наука о данных? Чем наука о данных отличается от статистики? Разве статистика не имеет много подтем? Как насчет больших данных, и как они связаны с наукой о данных? Разве сбор данных не совпадает с наукой о данных? Люди не все согласятся и по всем этим темам.

...