Question

Я хочу применить K-Means к набору данных, в котором первый столбец - это имя пользователя (строка), а второй столбец - это некоторый идентификатор (целое число), рассматривающий возможность кластеризации идентификатора в том же кластере.

Пример данных

Имя пользователя Связанный идентификатор

rajan.kumar 2134
rajan.kumar 2134
rajan.kumar 2194
mano.singh 5196
mano.singh 2134
mano.singh 2194

Можем ли мы применить K-средства в Python для группировки вышеуказанного набора данныхрассматривая группу как идентификатор, потому что я искал много статей не имеют решения на основе строки.

Anony-Mousse · Answer 1 · 12 июня 2018

Это не проблема кластеризации.

Вы, похоже, ищете SQL GROUP_BY.

K-средства для набора данных, в котором первый столбец - имя пользователя (строка), а второй столбец - идентификатор (целое число) для кластеризации идентификатора.

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

K-средства для набора данных, в котором первый столбец - имя пользователя (строка), а второй столбец - идентификатор (целое число) для кластеризации идентификатора.

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы