Question

Я хочу получить N ближайших точек данных из центра (на основе евклидова расстояния) в каждом кластере после развертывания алгоритма K-средних.Я могу получить индексы точек данных, используя

np.where(km.labels_ == 0)

Franco Piccolo · Answer 1 · 15 декабря 2018

Вы можете использовать метод transform класса kmeans, который вычисляет расстояние каждой точки данных до каждого из кластеров.

Затем, если вы хотите, чтобы верхние N точки начинались с 0-гоиндекс cluster тогда вы можете просто сделать:

cluster = 0
N = 2
np.sort(kmeans.transform(X)[:,cluster])[:N]

Anony-Mousse · Answer 2 · 15 декабря 2018

Простой четырехэтапный процесс:

Вычисление среднего значения
Вычисление расстояний от среднего значения
Выберите наименьшее k с помощью argmin
сопоставляет индексы заката с индексами наборов данных путем индексации в возвращаемое значение np.where

Как получить N номеров точек данных, ближайших к центру кластера?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как получить N номеров точек данных, ближайших к центру кластера?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы