увеличить значения года до месяца в пандах - PullRequest
1 голос
/ 15 октября 2019

У меня продажи по годам:

pd.DataFrame({'year':[2015,2016,2017],'value':['12','24','30']})
    year    value
0   2015    12
1   2016    24
2   2017    36

Я хочу экстраполировать на месяцы:

yyyymm value
201501 1 (ie 12/12, etc)
201502 1
...
201512 1
201601 2
...
201712 3

есть предложения?

1 Ответ

0 голосов
/ 15 октября 2019

Одной из идей является использование перекрестного соединения с вспомогательным DataFrame, преобразование столбцов в строки и добавление 0 на Series.str.zfill:

df1 = pd.DataFrame({'m': range(1, 13), 'a' : 1})

df = df.assign(a = 1).merge(df1).drop('a', 1)
df['year'] = df['year'].astype(str) + df.pop('m').astype(str).str.zfill(2)
df = df.rename(columns={'year':'yyyymm'})

Другое решение - создание MultiIndex ииспользуйте DataFrame.reindex:

mux = pd.MultiIndex.from_product([df['year'], range(1, 13)], names=['yyyymm','m'])
df = df.set_index('year').reindex(mux, level=0).reset_index()
df['yyyymm'] = df['yyyymm'].astype(str) + df.pop('m').astype(str).str.zfill(2)

print (df.head(15))
    yyyymm value
0   201501    12
1   201502    12
2   201503    12
3   201504    12
4   201505    12
5   201506    12
6   201507    12
7   201508    12
8   201509    12
9   201510    12
10  201511    12
11  201512    12
12  201601    24
13  201602    24
14  201603    24
...