K-среднее для нескольких полей KPI - PullRequest
0 голосов
/ 28 апреля 2020

Я новичок в машинном обучении. Мой вопрос может быть очень базовым c. Я получил обученную модель со средним k, эта модель основана на 6 полях KPI. У меня есть набор данных 6 KPI, я успешно использовал метод прогнозирования и создал кластер, используя файл pkl. У меня есть несколько вопросов после прочтения нескольких блогов -

  1. Желательно ли разработать модель среднего значения с использованием 6 KPI?
  2. Я пытаюсь добавить визуализацию, которая изображает кластер и центроид, но не смог решить, какой график я могу использовать для всех этих 6 полей. Какой график я могу использовать для визуализации?

1 Ответ

0 голосов
/ 29 апреля 2020

Вы не предоставили здесь никакого кода, и это нормально, по крайней мере, в этом случае. Я полагаю, вы бы сделали что-то вроде этого.

from scipy.cluster.vq import kmeans,vq
from sklearn.cluster import KMeans

# etc., etc.

data = np.asarray([np.asarray(df['Feature1']),np.asarray(df['Feature2'])])
# etc., etc., etc.
# run a few experiences using 2-6 KPIs. 

# computing K-Means with K = 5 (5 clusters)
centroids,_ = kmeans(data,5)
# assign each sample to a cluster
idx,_ = vq(data,centroids)

Имеет ли это смысл? Проверьте ссылку ниже. Я думаю, что этот парень очень хорошо объясняет эту концепцию.

https://www.pythonforfinance.net/2018/02/08/stock-clusters-using-k-means-algorithm-in-python/

...