Я пытаюсь использовать индекс datetime фрейма данных pandas, чтобы назначить новый столбец под названием «сезон».
winter =[12,1,2]
spring =[3,4,5]
summer =[6,7,8]
autumn =[9,10,11]
DTX_index = [datetime(2017, 2, 1).date(), datetime(2017, 3, 1).date(), datetime(2017, 6, 1).date(), datetime(2017, 9, 1).date()]
DTX_index = pd.to_datetime(DTX_index, utc=True)
df = pd.DataFrame(index=DTX_index)
Я надеюсь на что-то вроде этого:
season
2017-02-01 00:00:00+00:00 winter
2017-03-01 00:00:00+00:00 spring
2017-06-01 00:00:00+00:00 summer
2017-09-01 00:00:00+00:00 autumn
назначить месяц
df['month'] = df.index.month
назначить логическое значение для одного сезона
df['season'] = df.index.month.isin([12,1,2])
Я не уверен, как назначить сезон, основанный на месяце в течение всего df? Я попытался применить функцию:
def add_season(x):
if x.index.month.isin([12,1,2]):
return 'winter'
elif x.index.month.isin([3,4,5]):
return 'spring'
elif x.index.month.isin([6,7,8]):
return 'summer'
elif x.index.month.isin([9,10,11]):
return 'autumn'
df['season'] = df.apply(add_season)
Но это возвращает ошибку значения:
ValueError: ('The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()', 'occurred at index season')
предположительно, потому что функция работает с целым рядом, а не по элементам.
Я уверен, что кто-то, кто имеет немного больше опыта применения функций, чем я, мог бы исправить это довольно быстро?
Большое спасибо