Считайте файл xlsx в python без потери информации - PullRequest
0 голосов
/ 14 апреля 2020

Цель - прочитать файл xlsx в python. Вся предоставленная информация только для того, чтобы дать контекст проблемы.

В этих примерах считываемая дата должна быть 2004/07/01

Как данные выглядят в "LibreCal c "

Вот то, что librecal c отображает

12/30/99
12/30/99
...

Вот то, как определяются фактические формулы ячеек.

=Date(2004,7,1)
=Date(2004,7,1)
...

Pandas

CASE 1 (pd.read_excel)

Отображаемые результаты

00:00:00
00:00:00
...

values функция возвращает

array([datetime.time(0, 0), datetime.time(0, 0), datetime.time(0, 0), ...,
       datetime.time(0, 0), datetime.time(0, 0), datetime.time(0, 0)],
      dtype=object)

CASE 2 (pd.read_excel(..., parse_date)

Отображаемые результаты

2020-04-14
2020-04-14
...

values функция возвращает

array(['2020-04-14T00:00:00.000000000', '2020-04-14T00:00:00.000000000',
       '2020-04-14T00:00:00.000000000', ...,
       '2020-04-14T00:00:00.000000000', '2020-04-14T00:00:00.000000000',
       '2020-04-14T00:00:00.000000000'], dtype='datetime64[ns]')

Какой является сегодняшняя дата, а не 2004/7/1


Таким образом, проблема, кажется, выходит за рамки просто переформатирование значений. Похоже, python не имеет ни малейшего представления, как анализировать даты.


enter image description here

1 Ответ

0 голосов
/ 14 апреля 2020

мои парни, если я запускаю «найти и заменить» и просто нахожу «= Дата (» и заменяю его на «= Дата (», тогда все работает. У меня около 40 файлов, которые мне нужно сделать, но это управляемо. Это безумие. Почему в мире это будет работать?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...