Генерируйте центриоды Кмеанов в порядке возрастания - PullRequest
3 голосов
/ 01 марта 2020

Я пытаюсь использовать алгоритм Kmean в Python с использованием библиотеки Sklearn. Мой вопрос заключается в том, есть ли способ, которым я могу генерировать центриоды в порядке возрастания. Например, вот мой код:

kmeanDataFrame = pd.DataFrame({'x':X,'y':Y})
kmean = KMeans(init='k-means++',n_clusters = 6,random_state=0, n_init=10)
kmean.fit(kmeanDataFrame)
print(kmean.labels_)
print(kmean.cluster_centers_)

Здесь X и Y - массивы, я даю данные по ранжированию населения разных лет. Например, центриоды постоянно меняются, когда я даю ему 2011, он генерирует центриоды следующим образом:

[[ 4.22019639  2.88409457]
[ 1.15267995  0.7954897 ]
[ 2.49913831  1.64727509]
[-1.71104298 -1.54454861]
[ 6.99545873  6.08921786]
[ 0.20412018  0.0517948 ]]

, а когда я прохожу в 2012 году, он генерирует так:

[[ 0.94596298  0.64243913]
[ 4.2710023   3.0083124 ]
[-0.27485671 -0.35197801]
[ 2.41465001  1.59198646]
[-6.514922   -4.53656495]
[ 7.77638888  7.18733868]]

Есть ли какой-либо способ что я могу генерировать центроиды в порядке возрастания (сначала отрицательные точки, затем положительные точки), например:

[[-1.71104298 -1.54454861],
[ 0.20412018  0.0517948 ],
[ 1.15267995  0.7954897 ],
[ 2.49913831  1.64727509],
[ 4.22019639  2.88409457],
[ 6.99545873  6.08921786]]

Ответы [ 2 ]

2 голосов
/ 01 марта 2020

Предположим, у вас произошла следующая кластеризация:

from sklearn.cluster import KMeans
np.random.seed(42)
X = np.random.rand(10000)
Y = np.random.rand(10000)
kmeanDataFrame = pd.DataFrame({'x':X,'y':Y})
kmean = KMeans(init='k-means++',n_clusters = 6,random_state=0, n_init=10)
kmean.fit(kmeanDataFrame)

cc = kmean.cluster_centers_
print(cc)

[[0.14575507 0.27937172]
 [0.76783063 0.80079467]
 [0.47849743 0.14838875]
 [0.2147012  0.79923057]
 [0.48920425 0.5285314 ]
 [0.83935504 0.27354554]]

Затем вы можете отсортировать по 0-му столбцу:

idx = np.argsort(cc[:,0])
cc[idx,:]
array([[0.14575507, 0.27937172],
       [0.2147012 , 0.79923057],
       [0.47849743, 0.14838875],
       [0.48920425, 0.5285314 ],
       [0.76783063, 0.80079467],
       [0.83935504, 0.27354554]])

или 1-му столбцу:

idx = np.argsort(cc[:,1])
cc[idx,:]
array([[0.47849743, 0.14838875],
       [0.83935504, 0.27354554],
       [0.14575507, 0.27937172],
       [0.48920425, 0.5285314 ],
       [0.2147012 , 0.79923057],
       [0.76783063, 0.80079467]])
1 голос
/ 01 марта 2020

После генерации средства список средств может быть отсортирован с использованием отсортированной функции в python. Как в приведенной ниже строке кода

sorted_Centers = sorted (kmean.cluster_centers _)

...