Есть ли способ перебрать серию дат и времени панд, выполняющих функцию? - PullRequest
0 голосов
/ 30 мая 2019

Я создал пользовательскую функцию, описывающую сезонность, и хочу добавить новый столбец в фрейм данных, применив эту функцию к ряду объектов даты и времени в фрейме данных pandas.Я пытаюсь создать список, содержащий значения функции date_season, примененной к датам в кадре данных.

Все переменные в функции date_season ниже имеют тип datetime.date, кроме 'dif', который является datetime.timedelta.

Вот функция:

import datetime as dt
import pandas as pd

def date_season(date):
    year = date.year
    min_season = dt.date(year,1,1)
    max_season = dt.date(year,6,30)
    dif = abs(max_season - date)
    dif_days = dif.days
    x = (((max_season - min_season).days) - dif.days * 2) / (max_season - min_season).days
    seasonality = np.sin(x * (np.pi) / 2)
    return(seasonality)

А вот как создается кадр данных pandas:

start = dt.date(2017,1,1)
end = dt.date(2019,12,31)
df = pd.DataFrame({'Date': pd.date_range(start, end, freq="D")})

Попытка создать новый список с параметром сезонности:

z = []
for index, row in df.iterrows():
    z.append(date_season(row.Date))

Возвращает сообщение об ошибке:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-105-63e9cb35ed55> in <module>()
      1 z = []
      2 for index, row in df.iterrows():
----> 3     z.append(date_season(row.Date))

<ipython-input-71-5e2b35e24e38> in date_season(date)
      3     min_season = dt.date(year,1,1)
      4     max_season = dt.date(year,6,30)
----> 5     dif = abs(max_season - date)
      6     dif_days = dif.days
      7     x = (((max_season - min_season).days) - dif.days * 2) / (max_season - min_season).days

pandas\_libs\tslibs\timestamps.pyx in 
pandas._libs.tslibs.timestamps._Timestamp.__sub__()

TypeError: descriptor '__sub__' requires a 'datetime.datetime' object but received a 'datetime.date'

Попытка:

new_df = df.apply(lambda x: date_season(x))

возвращает

AttributeError: ("'Series' object has no attribute 'year'", 'occurred at index Date')

Не уверен, почему требуется объект datetime.datetime, потому что функция работает с одиночными входами в datetime.Формат даты.Есть ли более простой способ перебрать даты и создать новый столбец с результатами этой функции?

1 Ответ

1 голос
/ 30 мая 2019

Вы должны определить min_season и max_season как объекты datetime панд вместо встроенного класса datetime в python. Это сбивает с толку, но они не являются полностью взаимозаменяемыми.

def date_season(date):
    year = date.year
    #use pandas.datetime
    min_season = pd.datetime(year,1,1)
    max_season = pd.datetime(year,6,30)
    dif = abs(max_season - date)
    dif_days = dif.days
    x = (((max_season - min_season).days) - dif.days * 2) / (max_season - min_season).days
    seasonality = np.sin(x * (np.pi) / 2)
    return(seasonality)

Теперь вы можете использовать applymap для всего вашего фрейма данных или использовать apply для одного столбца.

new_df = df.applymap(date_season)

или

df['Date'].apply(date_season)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...