Допустим, у меня есть CSV-файл со следующей структурой (800 тыс. Записей), и я хочу идентифицировать существующие шаблоны комбинаций продуктов (например, шаблон, который часто объединяет Product XYZ):
Customer_ID | Product_ID | Revenue
1 A X
1 B X
1 C X
2 A X
2 D X
3 A X
4 F X
Как бы вы подошли к этому с точки зрения науки о данных?Какие методы вы бы использовали, и какие шаги вам нужно предпринять (например, псевдокод подхода, который вы бы порекомендовали, желательно на python).
Большое вам спасибо за помощь.Это высоко ценится!С уважением Саймон