Это мой набор данных: https://archive.ics.uci.edu/ml/datasets/Bank+Marketing
В этом наборе данных есть 7 числовых переменных, и как новичок я не смог обработать матрицу расстояний, используя евклидово расстояние. Я перепробовал много вещей на inte rnet, но не смог решить. Данные очень большие, поэтому иногда они вызывают проблемы с памятью.
from sklearn.metrics.pairwise import euclidean_distances
X = [[0, 1], [1, 1]]
# distance between rows of X
euclidean_distances(X, X)
# result:
# array([[0., 1.],
# [1., 0.]])
# get distance to origin
euclidean_distances(X, [[0, 0]])
# Result:
# array([[1. ],
# [1.41421356]])
Пример, который я пытался применить к своему коду, думаю, он работает, но я не смог применить его должным образом.