У меня есть базовый период (период времени - данные за 1 месяц) с данными баллов TFIDF. После применения StandardScaler я применил PCA. Теперь, после анализа KMeans, у меня есть 2 выдающихся кластера. И я могу получить центроиды кластеров каждого кластера из 'cluster_centers_' результата KMeans. И я могу получить точки центроида кластера, т. Е. Центр каждого кластера [координаты x, y] из cluster_centers_
clusterer = KMeans(n_clusters=2, random_state=10)
cluster_labels = clusterer.fit_predict(PCAData)
centers = clusterer.cluster_centers_
if clusterVal == 2:
cl1center = [centers[:, 0][0], centers[:, 1][0]]
cl2center = [centers[:, 0][1], centers[:, 1][1]]
centroids= [cl1center,cl2center]
Я выполняю анализ шаблонов кластеров, где я буду использовать этот центроид двух кластеров из базового периодаи будет использовать это для создания двух кластеров на основе расстояний в другом периоде (данные периода времени 2 месяца).
Проблема в том, что у меня есть [x, y] координата центроидов из кластеров базового периода. И данные масштабатора 2-го периода времени находятся в массиве
array([[-1.75726785, -3.04055979, -3.61153087, ..., -2.54884975,
-2.44481011, -3.22295041],
[-1.75726785, -3.04055979, -3.61153087, ..., -2.54884975,
-2.44481011, -3.22295041],
[-1.75726785, -3.04055979, -3.61153087, ..., -2.54884975,
0.69966379, -3.22295041],
...,
[-0.39550133, 0.74182029, -1.36022834, ..., -0.28311412,
0.65864655, 0.96197786],
[-0.39550133, 0.74182029, -1.36022834, ..., -0.28311412,
0.65864655, 0.96197786],
[-0.39550133, 0.74182029, -1.36022834, ..., -0.28311412,
0.65864655, 0.96197786]])
Как рассчитать расстояние между центроидом и точками каждого масштабатора 2-го таймфрейма, чтобы создать два кластера? Пожалуйста помоги. Любые предложения будут большой помощью.
С уважением, Sudeep