У меня есть набор данных о покупках
user_id, item_id
==================
1, 1
1, 2
1, 3
2, 2
2, 3
3, 8
3, 9
4, 8
4, 9
Исходя из этого, я хочу создать несколько «кластеров». Из данных видно, что пользователи 1 и 2 очень похожи, а пользователи 3 и 4 очень похожи.
Я не знаю, как я могу создать этот анализ с помощью машинного обучения в Python.
Я думаю, это могут быть расстояния с
1, 2, 3, 4
1, -, ?, ?, ?
2, ?, -, ?, ?
3, ?, ?, -, ?
4, ?, ?, ?, -
чтобы я мог определить, насколько каждый пользователь похож на других.
Что я хочу, так это определить, принадлежат ли различные пользователи к определенным группам на основе их покупок. Например, если некоторые пользователи покупают много предметов, связанных с ребенком, они могут быть новыми матерями / отцами, а пользователи, которые покупают много книг по программному обеспечению, могут быть ИТ-специалистами / студентами.