Как создать сводную таблицу, используя столбец datetime в pandas - PullRequest
0 голосов
/ 20 октября 2019

У меня есть столбец datetime и столбец значений, которые я хотел бы повернуть. Цель состоит в том, чтобы создать столбец для каждого месяца и строку, в которой показано среднее значение для каждого месяца.

import pandas as pd
import numpy as np
import calendar

d = dict(enumerate(calendar.month_abbr))

rng = pd.date_range('2019-01-01', periods=365, freq='D')
df= pd.DataFrame({'Date': rng, 'Val': np.random.randint(10, size=365)}) 
df.set_index('Date', inplace=True)

df = df.resample('1M').mean().reset_index()
df['Month'] = df['Date'].apply(lambda x: d[x.month])

df.pivot(columns='Month', values='Val')

На выходе должно быть 12 столбцов: январь, февраль, март и т. Д. ... и 1 строкаэто среднее значение для каждого месяца.

Ответы [ 2 ]

1 голос
/ 20 октября 2019

Вместо этого используйте pd.pivot_table:

import pandas as pd
import numpy as np
import calendar

d = dict(enumerate(calendar.month_abbr))

rng = pd.date_range('2019-01-01', periods=365, freq='D')
df= pd.DataFrame({'Date': rng, 'Val': np.random.randint(10, size=365)}) 
df.set_index('Date', inplace=True)

df = df.resample('1M').mean().reset_index()
df['Month'] = df['Date'].apply(lambda x: d[x.month])

pd.pivot_table(data=df,columns='Month', values='Val', aggfunc=np.mean)

, вывод:

Month  Apr       Aug       Dec       Feb       Jan       Jul       Jun  \
Val    3.2  4.419355  4.548387  5.857143  5.322581  4.354839  5.033333   

Month       Mar       May       Nov       Oct  Sep  
Val    4.645161  4.193548  4.966667  3.645161  3.7  
0 голосов
/ 20 октября 2019

Принудительно df.index на все 0 и вызовите вашу команду pivot с помощью reindex

df.index = [0]*df.index.size    
df_out = df.pivot(columns='Month', values='Val').reindex(columns=df.Month)

Или выполните прямую однострочную

df_out = (df.set_index(np.array([0]*df.index.size))
            .pivot(columns='Month', values='Val').reindex(columns=df.Month))


Out[88]:
Month       Jan   Feb       Mar       Apr       May  Jun       Jul       Aug  \
0      4.290323  3.75  4.032258  4.033333  4.225806  4.4  4.774194  4.774194

Month  Sep      Oct       Nov       Dec
0      4.6  4.16129  4.233333  3.935484

Если вы не хотите изменять df.index, как указано выше, вы можете просто использовать pivot с ffill, bfill и iloc

df_out = (df.pivot(columns='Month', values='Val').ffill().bfill().iloc[[0]]
            .reindex(columns=df.Month))


Out[99]:
Month       Jan   Feb       Mar       Apr       May  Jun       Jul       Aug  \
0      4.290323  3.75  4.032258  4.033333  4.225806  4.4  4.774194  4.774194

Month  Sep      Oct       Nov       Dec
0      4.6  4.16129  4.233333  3.935484
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...