Pandas read_excel неправильно анализирует даты - вместо этого возвращает постоянную дату - PullRequest
0 голосов
/ 13 апреля 2020

Я прочитал файл .xlsb и проанализировал столбцы даты, используя следующий код:

dateparser = lambda x: pd.to_datetime(x)

data = pd.read_excel(r"test.xlsb", engine="pyxlsb",
                 parse_dates=["start_date","end_date"],
                 date_parser=dateparser
                 )

Мои входные столбцы в файле .xlsb имеют формат ДД / ММ / ГГГГ (например, 26.01.2008). В качестве вывода вышеупомянутого кода я получаю, например: 1970-01-01 00: 00: 00.000038840 . Изменяются только последние 5 цифр.

Если я читаю один и тот же файл без разбора дат, те же столбцы относятся к типу float64 и содержат только последние 5 цифр выходных данных (например, 38840.0 ). .

Я предполагаю, что это проблема, связанная с самим кодированием даты. Кто-нибудь знает, как решить эту проблему?

...