Найти еженедельные и выходные средние продажи за месяц - PullRequest
0 голосов
/ 27 марта 2019

Я пытаюсь сравнить средние продажи в выходные и будние дни в Python.

Предположим, у меня есть набор данных

 Order Date  Units Sold day_week
2017-07-01  100 Sat
2017-07-02  100 Sun
2017-07-03  90  Mon
2017-07-04  90  Tue
2017-07-05  90  Wed
2017-07-06  90  Thu
2017-07-07  90  Fri
2017-07-08  80  Sat
2017-07-09  80  Sun
2017-07-10  100 Mon
2017-07-11  100 Tue
2017-07-12  100 Wed
2017-07-13  100 Thu
2017-07-14  100 Fri

Я хочу сравнить (средние продажи в выходные дни, которыесб и вс) с (средние продажи по будням), но индивидуально (1-й и 2-й с 3,4,5,6,7 продажами) и (8,9 с 10,11,12,13,14)

Таким образом, на 1-й неделе средние продажи в выходные дни (100) будут превышать средние продажи в будние дни (90), а на 2-й неделе средние продажи в выходные дни (80) будут меньше средних продаж в будние дни (100)

1 Ответ

0 голосов
/ 27 марта 2019

Хорошо, здесь предполагается, что ваши данные в формате DataFrame, но дата / время просты str (т.е. не datetime):

import pandas as pd

# setting up part of your dataset

df = pd.DataFrame.from_dict({
    'date':['2017-07-01','2017-07-02','2017-07-03','2017-07-04'],
    'units_sold': [100,100,90,90],
    'day_week': ['Sat','Sun','Mon','Tue']}
)

# defining a new column to help us, grouping by it and then summing:

df['is_weekend']=df['day_week'].apply(lambda x: x in {'Sat','Sun'})
df.groupby('is_weekend').mean()

Кроме того, в будущем будет полезно написать код, который генерирует ваш набор данных (или небольшую его часть), в противном случае читатель должен сделать это сам.

...