Как кластеризовать группу векторов? - PullRequest
0 голосов
/ 14 апреля 2019

У меня около 1000 векторов с числовым значением 9000.Мне нужен какой-то способ найти сходство между ними или объединить их.Какой подход / алгоритм для этого?Я думал о k-means, но работает ли он с такими данными?Заранее спасибо.

1 Ответ

0 голосов
/ 14 апреля 2019

В таких очень больших измерениях (9000) вы, скорее всего, будете страдать от проклятия размерности, я бы предложил запустить алгоритм уменьшения размерности (например, PCA или T-SNE) до использования алгоритма кластеризации в таком очень высоком размеры.

Подробнее о методах уменьшения размерности можно прочитать здесь

Вы также можете больше узнать о проклятии размерности и о том, почему трудно найти значимые кластеры в больших измерениях здесь .

...