Python / Panda - Как читать информацию о часовом поясе в to_datetime ()? - PullRequest
0 голосов
/ 07 мая 2020
• 1000 .

Вот как выглядят строки и формат, который я пытался использовать.

In [8]: ts_temp
Out[8]: 
0     Sun Dec 22 2019 07:40:00 GMT+0100
1     Sun Dec 22 2019 07:45:00 GMT+0100
2     Sun Dec 22 2019 07:50:00 GMT+0100

date_format = "%a %b %d %Y %H:%M:%S %Z"
index = pd.to_datetime(ts_temp, utc = True, format=date_format)

К сожалению, затем я получаю это сообщение об ошибке.

ValueError: unconverted data remains: 100

Я могу подтвердить, что использование infer_datetime_format = True вместо этого работает с правильным чтением часового пояса, но мне кажется, что это требует времени.

Мне бы хотелось посмотреть, могу ли я улучшить время работы, указав напрямую формат.

Спасибо за любую помощь, лучшие!

Ответы [ 2 ]

0 голосов
/ 08 мая 2020

Хорошо, я наконец узнал. Правильный формат: date_format = "%a %b %d %Y %H:%M:%S GMT%z"

И, похоже, его использование примерно на 40% быстрее, чем «классический» вывод.

0 голосов
/ 07 мая 2020

Вы можете позволить pandas выполнять тяжелую работу по формату времени, удалив параметр формата:

pd.to_datetime(tx_temp, utc=True)

Вывод:

0   2019-12-22 08:40:00+00:00
1   2019-12-22 08:45:00+00:00
2   2019-12-22 08:50:00+00:00
Name: 1, dtype: datetime64[ns, UTC]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...