У меня есть миллиарды точек в 128-мерном пространстве.Каждая координата точки находится в диапазоне (-1; 1).Алгоритм получает в качестве входных данных точку и возвращает все точки, евклидово расстояние до которых от целевой точки меньше 0,5.Но я хочу, чтобы алгоритм работал быстро без расчета расстояния до каждой точки.
Поэтому мне нужно создать кластеры с точками, которые расположены рядом друг с другом, и поиск должен быть выполнен внутри кластера, ближайшего к целевой точке.
Я пробовал кластеризовать, используя k-means ++ , GMM , kd-tree , но точность поиска была ниже 80%.Что бы вы порекомендовали в этом случае?
PS Приближенные алгоритмы ближайшего соседа не дают значительного увеличения скорости.