У меня есть такой фрейм данных:
pd.DataFrame([{"order_id": 1234, "product": "milk"},
{"order_id": 1234, "product": "butter"},
{"order_id": 4321, "product": "bread"},
{"order_id": 4321, "product": "milk"},
{"order_id": 4321, "product": "butter"},
{"order_id": 1111, "product": "corn"},
{"order_id": 1111, "product": "cereal"},
{"order_id": 8888, "product": "milk"}])
order_id product
0 1234 milk
1 1234 butter
2 4321 bread
3 4321 milk
4 4321 butter
5 1111 corn
6 1111 cereal
7 8888 milk
Мне нужно найти наиболее распространенную комбинацию продуктов, без необходимости определять, сколько продуктов положить в эти комбинации.
В этом примере показано, как вернуть молоко и масло как два наиболее купленных вместе итена.
Я пытался сгруппировать их по order_id, но не смог найти решение для получения комбинаций внутри групп.