Моя цель - выяснить, могу ли я манипулировать и измерять данные из графика PCA или t-SNE в Python. Я хочу знать, есть ли способ, которым я могу найти расстояния точек от центра скоплений.
Я думаю, что есть способ, но я не слишком уверен.
Вы не указываете слишком много, но, возможно, это поможет вам:
Информация о методах кластеризации: https://scikit-learn.org/stable/modules/clustering.html#clustering
Уменьшение размерности: https://scikit-learn.org/stable/modules/decomposition.html#decompositions
Может быть, вам поможет следующий скрипт:
from sklearn.decomposition import PCA X= your_data_variables cluster = "your cluster technique" cluster.fit(X) pca=PCA(n_components= 2) pca.fit(X) pca_data = pd.DataFrame(pca.transform(X)) centers = pca.transform(cluster.cluster_centers_)
Теперь у вас есть центр кластеров и ваши данные в двух измерениях, и вы можете рассчитать расстояние как хотите.