Как я могу реализовать кластеризацию Kmeans на набор данных с 3 функциями: возраст, вес, рост некоторых случайных людей? - PullRequest
0 голосов
/ 03 мая 2019

Я не могу связаться с моей информацией набора данных CSV и настроить кластеризацию kmeans, пожалуйста, помогите мне!

моя форма набора данных:

       Unnamed: 0         Name  Age  Weight  Height
0               0      person0   59     133     163
1               1      person1   36      94     166
2               2      person2   58      49     165
3               3      person3   64     104     184
4               4      person4    3      78     144
5               5      person5   78     138     158
6               6      person6   88     115     195
7               7      person7   79     113     193
.
.
.
99999

мой код:

dataset = pd.read_csv(r'RandomPersonsInfo100K.csv')
dataset.head()
print(dataset)

X, y = dataset(n_samples=100000,
               n_features=3,
               centers=5,
               cluster_std=5,
               shuffle=True,
               random_state=0)
import matplotlib.pyplot as plt
plt.scatter(X[:,0],
            X[:,1],
            c='white',
            marker='o',
            edgecolor='black',
            s=50)
plt.grid()
plt.show()

from sklearn.cluster import KMeans
km = KMeans(n_clusters=3,
            init='random',
            n_init=10,
            max_iter=300,
            tol=1e-04,
            random_state=0)
y_km = km.fit_predict(X)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...