Так что я использую алгоритм кластеризации KProtoypes для кластеризации по смешанным переменным, которые включают как категориальные, так и числовые столбцы.
И я получаю сообщение об ошибке:
'>' не поддерживается между экземплярами 'str' и 'int'
А также все функции имеют согласованные типы данных.
Я поделился фрагментом кода, который я использовал для запуска вместе со скриншотом данных.
Я просто хочу кластеризовать этот тип данных, любые предложения по кластеризации будут приняты.
Кроме того, мои данные таковы:
А Информация о данных выглядит следующим образом:
И вот код, который я написал для алгоритма k_prototype:
kp = KПрототипы (n_clusters = 3, init = 'random', подробный = True)
kp.fit (X_dummy, категоричны = [7,8,9,10,11,12,13])
Также, проверьте список категорий, который я передал в kp.fit