У меня есть набор данных с 1 000 000 записей.Мне нужно найти евклидову матрицу расстояний для этого набора данных.Следует создать матрицу 1 000 000 * 1 00 000.В питоне у нас есть squareform(pdist(x))
.Поскольку я не могу выполнить ту же функцию на RDD, как это сделать на платформе spark в Python?