Рыночная корзина и кластеризация в Python - PullRequest
0 голосов
/ 24 мая 2018

У меня есть большие панды DataFrame, которые выглядят так:

OrderID     OrderedItems    ItemsQuantity
10052009    I0                  2
10052009    I1                  1
10052009    I2                  1
10052009    I3                  1
10448900    I4                  5
10448900    I5                  5
10189322    I2                  1
10189322    I2                  1

Теперь я хочу выяснить, какие все предметы заказаны вместе и преобладают связки.

1 Ответ

0 голосов
/ 24 мая 2018

Я предполагаю, что вы знакомы с алгоритмами кластеризации и т. Д. Вы можете использовать эти данные и с помощью sklearn запустите K Means на любом другом алгоритме кластеризации.

http://scikit -learn.org / stable / modules / generate / sklearn.cluster.KMeans.html

PS: я предполагаю, что это всего лишь образец данных.

Далее аналогичным образом вы можете запустить ассоциативные алгоритмы.

...