Кластеризация бинарных функций - PullRequest
0 голосов
/ 09 апреля 2020

У меня есть датафрейм с 30+ двоичными функциями. Каждая функция представляет вопрос в опросе, а каждая строка представляет респондента (их почти 3000).

Вопросы касаются различных видов развлечений, которые могут заинтересовать респондентов. 0 означает отсутствие интереса, 1 указывает на интерес. Я хотел бы объединить респондентов в группы, которые предпочитают подобные виды развлечений.

Я знаю, что k-means не подходит для бинарных функций, но мне не особо повезло, когда я нашел альтернативный подход. Кто-нибудь может предложить что-то для меня? Большое спасибо!

...