Цель - прочитать файл xlsx в python. Вся предоставленная информация только для того, чтобы дать контекст проблемы.
В этих примерах считываемая дата должна быть 2004/07/01
Как данные выглядят в "LibreCal c "
Вот то, что librecal c отображает
12/30/99
12/30/99
...
Вот то, как определяются фактические формулы ячеек.
=Date(2004,7,1)
=Date(2004,7,1)
...
Pandas
CASE 1 (pd.read_excel
)
Отображаемые результаты
00:00:00
00:00:00
...
values
функция возвращает
array([datetime.time(0, 0), datetime.time(0, 0), datetime.time(0, 0), ...,
datetime.time(0, 0), datetime.time(0, 0), datetime.time(0, 0)],
dtype=object)
CASE 2 (pd.read_excel(..., parse_date)
Отображаемые результаты
2020-04-14
2020-04-14
...
values
функция возвращает
array(['2020-04-14T00:00:00.000000000', '2020-04-14T00:00:00.000000000',
'2020-04-14T00:00:00.000000000', ...,
'2020-04-14T00:00:00.000000000', '2020-04-14T00:00:00.000000000',
'2020-04-14T00:00:00.000000000'], dtype='datetime64[ns]')
Какой является сегодняшняя дата, а не 2004/7/1
Таким образом, проблема, кажется, выходит за рамки просто переформатирование значений. Похоже, python не имеет ни малейшего представления, как анализировать даты.