Точечная кластеризация в 128D пространстве - PullRequest
0 голосов
/ 28 января 2019

У меня есть миллиарды точек в 128-мерном пространстве.Каждая координата точки находится в диапазоне (-1; 1).Алгоритм получает в качестве входных данных точку и возвращает все точки, евклидово расстояние до которых от целевой точки меньше 0,5.Но я хочу, чтобы алгоритм работал быстро без расчета расстояния до каждой точки.

Поэтому мне нужно создать кластеры с точками, которые расположены рядом друг с другом, и поиск должен быть выполнен внутри кластера, ближайшего к целевой точке.

Я пробовал кластеризовать, используя k-means ++ , GMM , kd-tree , но точность поиска была ниже 80%.Что бы вы порекомендовали в этом случае?

PS Приближенные алгоритмы ближайшего соседа не дают значительного увеличения скорости.

...