Найти шаблоны схожих функций / комбинаций продуктов (желательно на python) - PullRequest
0 голосов
/ 17 февраля 2019

Допустим, у меня есть CSV-файл со следующей структурой (800 тыс. Записей), и я хочу идентифицировать существующие шаблоны комбинаций продуктов (например, шаблон, который часто объединяет Product XYZ):

Customer_ID | Product_ID | Revenue
    1             A          X
    1             B          X
    1             C          X
    2             A          X
    2             D          X
    3             A          X
    4             F          X

Как бы вы подошли к этому с точки зрения науки о данных?Какие методы вы бы использовали, и какие шаги вам нужно предпринять (например, псевдокод подхода, который вы бы порекомендовали, желательно на python).

Большое вам спасибо за помощь.Это высоко ценится!С уважением Саймон

1 Ответ

0 голосов
/ 18 февраля 2019

Существует стандартная задача интеллектуального анализа данных, известная как

Анализ часто встречающихся предметов

он же анализ рыночной корзины.

В ней рассматриваются продукты, часто покупаемые вместе.

Вы действительно должны сначала прочитать некоторые основные книги и Википедию ...

...