CSV с форматом времени 00: 00.0 (mm: ss.f) - как я могу понять это в Python? - PullRequest
0 голосов
/ 05 мая 2020

У меня есть набор данных от стороннего поставщика в виде файла csv. В одном столбце данные должны показывать время. Однако формат, даже при открытии файла csv как обычного текста, нечетный - в 12 часов утра он будет показывать 00: 00.0. Что-то вроде 10:20 будет 20: 00.0 (часы полностью отсутствуют).

Этого незнакомца отличает то, что Excel его понимает. Если я открою файл csv в Excel, я могу изменить числовой формат одного раза, и он покажет мне правильное время.

Я пробовал много вещей в Python, в основном используя pandas, чтобы попытаться отформатировать это время во что-то, что: а) отражает фактическое время и б) будет работать с другими системами. После небольшого исследования кажется, что эта может быть проблемой, происходящей от Lotus-1-2-3 и системы, которую сторонняя сторона использовала для создания этого набора данных.

Некоторые из вещей, которые я пробовал:

  • анализ столбца как даты при импорте как csv с pandas, а затем с использованием pd.to_datetime ()
  • Использование pd.to_datetime без синтаксического анализа столбца как строки
  • Многие другие, но с двумя вышеперечисленными попытками и просмотром необработанных данных это почти похоже на то, что сама информация отсутствует в значении, и только Excel может ее прочитать

Можно ли использовать это поле времени в Python? К сожалению, набор данных слишком велик для открытия в Excel, иначе я бы просто укусил пулю и правильно отформатировал число там.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...