Разбор CSV с изменением часового пояса (из-за перехода на летнее время) с pandas - PullRequest
0 голосов
/ 19 февраля 2020

Я пытаюсь проанализировать CSV, который выглядит следующим образом

time                                val
28.10.2007 00:00:00.000 GMT+0100    1
28.10.2007 00:01:00.000 GMT+0100    2
28.10.2007 01:00:00.000 GMT-0000    3
28.10.2007 01:01:00.000 GMT-0000    4

Для этого я использую

pd.read_csv(f,
            parse_dates=[0],
            dayfirst=True,
            index_col=0)

Однако результат выглядит так

                           val
time                          
2007-10-28 00:00:00-01:00    1
2007-10-28 00:01:00-01:00    2
2007-10-28 00:00:00-01:00    3
2007-10-28 00:01:00-01:00    4

Это приводит к дублированию значений в 3-й и 4-й строке. Есть ли способ попросить pandas преобразовать это время в UT C и понять изменение в TZ?

1 Ответ

2 голосов
/ 19 февраля 2020

Я попробовал это, и как-то это работает, но я не знаю, хотите ли вы этого.

df = pd.read_csv('data.csv')

df['time'] = pd.to_datetime(df['time'], format='%d.%m.%Y %H:%M:%S.%f GMT%z')
df['time_'] = pd.to_datetime(df['time'], utc=True)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...