Как мне получить дату из фрейма данных, заполненного этими строками? - PullRequest
0 голосов
/ 26 апреля 2020

Мне нужно взять их и преобразовать каждую дату в объект даты и времени. У меня есть 500 столбцов этого, но нужно извлечь дату.

'' '0 Рецензировано в США 30 декабря, ...

1 Рецензировано в США 28 августа 2019 года

2 Рецензировано в США Штаты 6 февраля 2020 года

3 Пересмотрены в США 6 ноября 2019 г.

4 Пересмотрены в США 6 марта 2020 г. '' '

1 Ответ

0 голосов
/ 26 апреля 2020

Если вы изолируете часть строки, которая представляет дату, вы можете использовать datetime.datetime.strptime () со строкой форматирования. В вашем примере строка даты - это только три последних слова:

from datetime import datetime

raw_line = '1 Reviewed in the United States on August 28, 2019'
date_str = " ".join(raw_line.split()[-3:])
parsed_date = datetime.strptime(date_str, '%B %d, %Y')

Если есть больше вариаций в том, как выглядит каждая строка, вы можете импортировать модуль re и написать Regex, чтобы изолировать строку даты.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...