Использование Scikit-learn KMeans для кластеризации многомерных массивов - PullRequest
0 голосов
/ 17 октября 2019

Я искал некоторые учебники по KMeans с помощью Scikit-learn, но мне не удалось найти что-то конкретное для моего случая.

У меня есть массив из нескольких объектов, который имеет формат

{
    name: 'Bob',
    vector: [14,12,15,10,16,16,7,15,7,4,16,13,4,16,13,17,13,13,10,8,14,17,10,16,6,14,16,13,15,17,12,7,14,13,15,10]
}

Итак, у меня есть массив этих объектов [ {...}, {...}, ... ]

Я хотел использовать поле vector этих объектов, чтобы использовать KMeans для получения кластеров похожих элементов.

Значения вектора нормализованы в диапазоне от 1 до 20.

Любая помощь будет отличной. Спасибо.

1 Ответ

3 голосов
/ 17 октября 2019

import lib

from sklearn.cluster import KMeans
import numpy as np

отформатируйте array of these objects для работы KMeans Scikit-learn

data_for_clustering = [row['vector'] for row in data]
data_for_clustering = np.array(data_for_clustering)

выполните кластеризацию

kmeans = KMeans(n_clusters=2, random_state=0).fit(data_for_clustering)

получите метки

kmeans.labels_
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...