Как я могу справиться с неправильным форматом года - PullRequest
0 голосов
/ 07 февраля 2019

Будучи новичком в питоне и пандах, я столкнулся со следующей проблемой.В моем фрейме данных у меня есть столбец с датами (гггг-мм-ддТч-мм-сек), где большая часть лет в порядке (выглядит как 2008), и часть, где год пишется как 0008. Из-за этого у меня естьпроблема с форматированием столбца с использованием pd.to_datetime.

Я думал сначала преобразовать его в двухзначный год (используя pd.to_datetime (df ['date']). dt.strftime ('% y% b,% d% H:% M:% S.% f +% Z ')), но я получил ошибку Наносекундная временная метка за пределами границ: 08-10-02 14: 41: 00.

ЕстьЕсть ли другие варианты конвертации 0008 в 2008 в dataframe?

Спасибо за помощь заранее

1 Ответ

0 голосов
/ 07 февраля 2019

Если формат для плохих данных всегда одинаков (так как в плохие годы всегда 4 символа), вы можете использовать str:

df = pd.DataFrame({'date':['2008-01-01', '0008-01-02']})
df['date'] = pd.to_datetime(df['date'].str[2:], yearfirst=True)

    date
0   2008-01-01
1   2008-01-02
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...