Я прочитал файл .xlsb и проанализировал столбцы даты, используя следующий код:
dateparser = lambda x: pd.to_datetime(x)
data = pd.read_excel(r"test.xlsb", engine="pyxlsb",
parse_dates=["start_date","end_date"],
date_parser=dateparser
)
Мои входные столбцы в файле .xlsb имеют формат ДД / ММ / ГГГГ (например, 26.01.2008). В качестве вывода вышеупомянутого кода я получаю, например: 1970-01-01 00: 00: 00.000038840 . Изменяются только последние 5 цифр.
Если я читаю один и тот же файл без разбора дат, те же столбцы относятся к типу float64 и содержат только последние 5 цифр выходных данных (например, 38840.0 ). .
Я предполагаю, что это проблема, связанная с самим кодированием даты. Кто-нибудь знает, как решить эту проблему?