как найти условного K ближайшего соседа эффективно - PullRequest
0 голосов
/ 11 мая 2019

У меня есть два набора данных (обучение и тестирование), оба имеют следующий формат в 3 столбца:

широта, долгота, год

Я пытаюсь найти 5 лучших соседей из обучениядля каждого тестового образца в тестовом наборе.Тем не менее, условие здесь состоит в том, что значение года каждого старшего соседа должно быть меньше, чем у тестового образца.

Если для каждого тестового образца я делаю выбор обучающего набора на основе первого года, а затем делаю KNN, это может бытьслишком медленно.

Теперь я думаю о том, чтобы найти KNN для каждого тестового образца в обучающем наборе, используя сначала очень большое значение K, чтобы найти их индекс, а затем проверить, что его год меньше года тестового образца.

Есть идея получше или пример кода?

...