Учитывая набор вложений, то есть набор [имя, векторное представление], как его хранить, чтобы запросы к ближайшим точкам вычислялись быстро.Например, учитывая 100 вложений в 2-мерном пространстве, если я запрашиваю структуру данных в 5 ближайших точках к (10,12), он возвращает {[a, (9,11.5)], [b, (12,14)], ...}
Тривиальный подход - вычислить все расстояния, отсортировать и вернуть топ-k точек.В качестве альтернативы можно подумать о сохранении в двумерном массиве блоков / единиц пространства mXn, чтобы охватить диапазон пространства внедрения.Я не думаю, что это расширяемо для более высоких измерений, но я хочу быть исправленным.