У меня есть набор данных, для которого мне нужно найти K ближайших соседей или всех соседей на расстоянии d. Для набора данных определено пользовательское расстояние, но это не евклидово расстояние.
Ранее я использовал метрических деревьев , в основном это дерево покрова. В этом случае, однако, мой набор данных будет больше, чем доступная память. Итак, есть ли какая-либо структура данных, которую можно использовать для ближайших соседей в наборе данных, хранящемся на диске? Хороший индекс базы данных для этой операции также будет полезен.