Я получаю сообщение об ошибке кластеризации с агрегированием кластеризации KPrototyping для кластеризации категориальных и числовых данных - PullRequest
0 голосов
/ 13 апреля 2019

Так что я использую алгоритм кластеризации KProtoypes для кластеризации по смешанным переменным, которые включают как категориальные, так и числовые столбцы. И я получаю сообщение об ошибке:

'>' не поддерживается между экземплярами 'str' и 'int'

А также все функции имеют согласованные типы данных. Я поделился фрагментом кода, который я использовал для запуска вместе со скриншотом данных. Я просто хочу кластеризовать этот тип данных, любые предложения по кластеризации будут приняты.

Кроме того, мои данные таковы: excel view of the data

А Информация о данных выглядит следующим образом: Info of the data

И вот код, который я написал для алгоритма k_prototype:

kp = KПрототипы (n_clusters = 3, init = 'random', подробный = True)
kp.fit (X_dummy, категоричны = [7,8,9,10,11,12,13])

Также, проверьте список категорий, который я передал в kp.fit

Ответы [ 2 ]

0 голосов
/ 22 апреля 2019

Это сообщение предполагает, что вы пытаетесь сравнить строковый объект (str) с целым числом (int). Вам необходимо очистить данные перед применением алгоритма. Мусор в это мусор из.

0 голосов
/ 20 апреля 2019

Столбец L в вашей таблице содержит строки и числа (0).

Это, вероятно, вызывает ошибку.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...