Я хочу применить K-Means к набору данных, в котором первый столбец - это имя пользователя (строка), а второй столбец - это некоторый идентификатор (целое число), рассматривающий возможность кластеризации идентификатора в том же кластере.
Пример данных
Имя пользователя Связанный идентификатор
- rajan.kumar 2134
- rajan.kumar 2134
- rajan.kumar 2194
- mano.singh 5196
- mano.singh 2134
- mano.singh 2194
Можем ли мы применить K-средства в Python для группировки вышеуказанного набора данныхрассматривая группу как идентификатор, потому что я искал много статей не имеют решения на основе строки.