Извлечение даты в конце кадра данных панд - PullRequest
0 голосов
/ 29 января 2019

У меня есть столбец данных в следующем формате:

bla bla bla, bla bla bla, bla bla bla, bla bla bla bla bla bla, 23/09/2012

Есть ли простой способ извлечь дату в конце строки из всех строк?Каждый раз в одном и том же формате ДД / ММ / ГГГГ.

Я мог бы разделить на последние, но было бы хорошо, если бы я мог указать, что мне нужна дата в случае ошибок в данных.

Ответы [ 3 ]

0 голосов
/ 29 января 2019

Вы можете использовать нарезку строк, за которой следует pd.to_datetime.Например:

df['col'] = pd.to_datetime(df['col'].str[-10:], dayfirst=True)
0 голосов
/ 29 января 2019

Используйте str.extract, если вы не уверены в том, что дата находится в конце строки

df['date'] = df['col'].str.extract('(\d{2}/\d{2}/\d{4})', expand = False)

0    23/09/2012
0 голосов
/ 29 января 2019

row.split(", ")[-1] - это строка 23/09/2012, теперь вы можете использовать модуль date для ее извлечения в объект Date.И используйте try / except для обработки ошибок.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...