Pandas dataframe в массив для дальнейшего использования - PullRequest
0 голосов
/ 04 июля 2018

У меня есть фрейм данных, который содержит CSV продаж KPI (количество, номер статьи и соответствующую дату) Мне нужно разделить фрейм данных на несколько, каждый из которых содержит данные для одного номера статьи (например, frame1 = 123, frame2 = 345 и т. Д.). )

Как я могу динамически разделить таким образом для дальнейшего использования в sklearns kmean? (сопоставьте разные номера артикулов и KPI их продажи) большое спасибо

1 Ответ

0 голосов
/ 04 июля 2018

Вы можете сгруппировать по номеру товара, используя groupBy.

grouped = df.groupby(['article_number'])    

Затем вы можете получить доступ к отдельным группам, используя

grouped.groups

или напрямую примените функции агрегирования, такие как grouped.sum(['quantity']), чтобы получить новый кадр с соответствующими значениями для каждой группы.

Также см. Руководство пользователя .

...