Панды условно присваивают значения новому столбцу на основе значения datetimeindex - PullRequest
0 голосов
/ 29 апреля 2019

Я пытаюсь использовать индекс datetime фрейма данных pandas, чтобы назначить новый столбец под названием «сезон».

winter =[12,1,2]
spring =[3,4,5]
summer =[6,7,8]
autumn =[9,10,11]

DTX_index = [datetime(2017, 2, 1).date(), datetime(2017, 3, 1).date(), datetime(2017, 6, 1).date(), datetime(2017, 9, 1).date()]
DTX_index = pd.to_datetime(DTX_index, utc=True)
df = pd.DataFrame(index=DTX_index)

Я надеюсь на что-то вроде этого:

                           season
2017-02-01 00:00:00+00:00   winter
2017-03-01 00:00:00+00:00   spring
2017-06-01 00:00:00+00:00   summer
2017-09-01 00:00:00+00:00   autumn

назначить месяц

df['month'] = df.index.month

назначить логическое значение для одного сезона

df['season'] = df.index.month.isin([12,1,2])

Я не уверен, как назначить сезон, основанный на месяце в течение всего df? Я попытался применить функцию:

def add_season(x):

    if x.index.month.isin([12,1,2]):
        return 'winter'
    elif x.index.month.isin([3,4,5]):
        return 'spring'
    elif x.index.month.isin([6,7,8]):
        return 'summer'
    elif x.index.month.isin([9,10,11]):
        return 'autumn'

df['season'] = df.apply(add_season)

Но это возвращает ошибку значения:

ValueError: ('The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()', 'occurred at index season')

предположительно, потому что функция работает с целым рядом, а не по элементам.

Я уверен, что кто-то, кто имеет немного больше опыта применения функций, чем я, мог бы исправить это довольно быстро?

Большое спасибо

Ответы [ 2 ]

3 голосов
/ 29 апреля 2019

IIUC

d={**dict.fromkeys(winter,'winter'),**dict.fromkeys(spring,'spring'),**dict.fromkeys(summer,'summer'),**dict.fromkeys(autumn,'autumn')}
df['Value']=list(map(d.get,df.index.month))
df
Out[697]: 
                            Value
2017-02-01 00:00:00+00:00  winter
2017-03-01 00:00:00+00:00  spring
2017-06-01 00:00:00+00:00  summer
2017-09-01 00:00:00+00:00  autumn
2 голосов
/ 29 апреля 2019

Вы можете создать рамку отображения и использовать map.Чтобы это работало правильно, сезоны должны содержать разные месяцы.


u = pd.DataFrame().assign(
    winter=winter, spring=spring, summer=summer, autumn=autumn
).melt().set_index('value')

df.assign(month=df.index.month.map(u.variable))

                            month
2017-02-01 00:00:00+00:00  winter
2017-03-01 00:00:00+00:00  spring
2017-06-01 00:00:00+00:00  summer
2017-09-01 00:00:00+00:00  autumn
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...