Самый эффективный способ определения среднего количества заказанных товаров в день в Python - PullRequest
0 голосов
/ 19 июня 2019

Я новичок в Python и имею большой набор данных (точнее, более 55 000 строк) в кадре данных со столбцами UPC, amount_picked и date.Я пытаюсь определить наиболее эффективный способ расчета среднего количества, отобранного за UPC в день.Есть ли способ, которым это может быть сделано более эффективно, чем использование вложенных циклов?

Я испробовал подход .mean, но, конечно, он предоставляет только среднее количество, отобранное на UPC за заказ.Я также пытался реализовать .groupby ().

practice_df_by_UPC = practice_df.groupby('UPC')
print(practice_df_by_UPC)

Я не получаю ошибок, но и не выводить.

Я хочу вывод, который позволил бы мне увидеть среднее количество предметов, выбранных UPC в день.Есть ли способ сделать это для фреймов данных, которые я не нахожу более эффективными, или есть набор вложенных циклов?

1 Ответ

0 голосов
/ 19 июня 2019

После переключения groupby с помощью set_index и выполнения некоторых дополнительных действий по устранению неполадок следующий код решил проблему и достиг цели определения среднего количества для указанного UPC и даты (например, UPC и дата подключены):

#creating multi-index based on date and UPC
practice_df.set_index(['date_expected', 'UPC'], inplace=True)

print('Mean:')
print(practice_df.loc['2019-05-15', '0000000004011'].mean())

Дополнение Inplace = True избавило от оставшейся ошибки. При печати фрейма данных он теперь мультииндексирован, организован сначала по дате, а затем по UPC.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...