Кластеризация данных масштабирования с использованием измерения расстояния от центроида - PullRequest
0 голосов
/ 06 ноября 2019

У меня есть базовый период (период времени - данные за 1 месяц) с данными баллов TFIDF. После применения StandardScaler я применил PCA. Теперь, после анализа KMeans, у меня есть 2 выдающихся кластера. И я могу получить центроиды кластеров каждого кластера из 'cluster_centers_' результата KMeans. И я могу получить точки центроида кластера, т. Е. Центр каждого кластера [координаты x, y] из cluster_centers_

clusterer = KMeans(n_clusters=2, random_state=10)
cluster_labels = clusterer.fit_predict(PCAData)
centers = clusterer.cluster_centers_
if clusterVal == 2:
  cl1center = [centers[:, 0][0], centers[:, 1][0]]
  cl2center = [centers[:, 0][1], centers[:, 1][1]]
  centroids= [cl1center,cl2center]

Я выполняю анализ шаблонов кластеров, где я буду использовать этот центроид двух кластеров из базового периодаи будет использовать это для создания двух кластеров на основе расстояний в другом периоде (данные периода времени 2 месяца).

Проблема в том, что у меня есть [x, y] координата центроидов из кластеров базового периода. И данные масштабатора 2-го периода времени находятся в массиве

array([[-1.75726785, -3.04055979, -3.61153087, ..., -2.54884975,
    -2.44481011, -3.22295041],
   [-1.75726785, -3.04055979, -3.61153087, ..., -2.54884975,
    -2.44481011, -3.22295041],
   [-1.75726785, -3.04055979, -3.61153087, ..., -2.54884975,
     0.69966379, -3.22295041],
   ...,
   [-0.39550133,  0.74182029, -1.36022834, ..., -0.28311412,
     0.65864655,  0.96197786],
   [-0.39550133,  0.74182029, -1.36022834, ..., -0.28311412,
     0.65864655,  0.96197786],
   [-0.39550133,  0.74182029, -1.36022834, ..., -0.28311412,
     0.65864655,  0.96197786]])

Как рассчитать расстояние между центроидом и точками каждого масштабатора 2-го таймфрейма, чтобы создать два кластера? Пожалуйста помоги. Любые предложения будут большой помощью.

С уважением, Sudeep

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...