Как вычислить матрицу расстояний в pyspark? - PullRequest
1 голос
/ 22 мая 2019

У меня есть набор данных с 1 000 000 записей.Мне нужно найти евклидову матрицу расстояний для этого набора данных.Следует создать матрицу 1 000 000 * 1 00 000.В питоне у нас есть squareform(pdist(x)).Поскольку я не могу выполнить ту же функцию на RDD, как это сделать на платформе spark в Python?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...