Как я могу реализовать K-средства в многопараметрическом наборе данных? - PullRequest
0 голосов
/ 10 июня 2019

https://archive.ics.uci.edu/ml/datasets/Auto+MPG У меня есть этот набор данных, я уже исправил пропущенные значения и нормализовал данные.Как я могу использовать K-средства?все, что я нашел до сих пор, для двух переменных.

1 Ответ

0 голосов
/ 10 июня 2019

Вы можете использовать scikit-learn для кластеризации k-средних.Пожалуйста, ознакомьтесь с приведенным ниже кодом, чтобы узнать, как его реализовать.

from sklearn.cluster import KMeans

# ---------- DATA ----------------
import numpy as np
np.random.seed(0)

# generated training data 
data = np.random.randint(1, 1000, size=(500, 25)) # data has 500 samples with 25 dim each

# testing data
test_data = np.random.randint(1, 1000, size=(10, 25)) # test_data has 10 samples with 25 dim each
# --------------------------------

# using KMean clustering from scikit-learn for training
kmeans = KMeans(n_clusters=16, random_state=0).fit(data)  # creating 16 clusters with the data

# labels for your clusters
kmean_labels = kmeans.labels_

# Predict the closest cluster for each sample
predicted_labels = kmeans.predict(test_data)

Для получения более подробной информации вы можете обратиться по этой ссылке .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...