Если у вас есть данные X уже в фрейме данных df
, то легко добавить столбец с идентификатором кластера; Вот пример с фиктивными 2D данными и 2 кластерами:
import numpy as np
import pandas as pd
from sklearn.cluster import KMeans
# dummy data:
X = np.array([[10, 2], [1, 4], [1, 0],
[1, 2], [10, 4], [10, 0]])
df = pd.DataFrame({'Column1':X[:,0],'Column2':X[:,1]})
kmeans = KMeans(n_clusters=2, init = 'k-means++', random_state=42).fit(X)
kmeans.labels_
# array([1, 0, 0, 0, 1, 1])
df['clusterID'] = kmeans.labels_
print(df)
Результат
Column1 Column2 clusterID
0 10 2 1
1 1 4 0
2 1 0 0
3 1 2 0
4 10 4 1
5 10 0 1