Ближайший сосед, похоже, не является частью MLLib Spark.Варианты, о которых я думаю, это найти реализацию распределенной искры или найти реализацию тензорного потока
Находятся ли в Databricks?Последние версии поддерживают распределенный Tensorflow.Я запустил большие тома, чем у вас, в одном узле кластера Densricks Tensorflow.
быстрый поиск обнаружил эти * тензор потока ближайшего соседа * искра ближайшего соседа
Обратите внимание, что я сам не пробовал.