Существует множество библиотек кластеризации, НО вы не можете закрыть глаза и выбрать одну, потому что если вы сделаете это, то весь анализ будет некорректным.
Вы должны задать себе вопрос: «Почему вы кластеризуетесь?», Чтобы уменьшить размерность или найти закономерности. Еще один вопрос, который вам нужно задать, это how are the different variables related to each other?
Данные, которые вы показали выше looks numerical
. Для группировки числовых данных вы можете использовать простейший алгоритм k-means . looks numerical
означает, что это действительно числовые значения или фиктивная кодировка для представления текстовых значений.
Другим важным вопросом в кластеризации является определение и доказательство наличия x
количества групп. Алгоритм k-means
является методом секционирования и требует ввода possible number of clusters
.
В целом, я рекомендую вам переосмыслить выполнимость этого вопроса и ответить на поставленные вопросы, чтобы найти осмысленное решение вашей проблемы.