У меня есть набор данных от стороннего поставщика в виде файла csv. В одном столбце данные должны показывать время. Однако формат, даже при открытии файла csv как обычного текста, нечетный - в 12 часов утра он будет показывать 00: 00.0. Что-то вроде 10:20 будет 20: 00.0 (часы полностью отсутствуют).
Этого незнакомца отличает то, что Excel его понимает. Если я открою файл csv в Excel, я могу изменить числовой формат одного раза, и он покажет мне правильное время.
Я пробовал много вещей в Python, в основном используя pandas, чтобы попытаться отформатировать это время во что-то, что: а) отражает фактическое время и б) будет работать с другими системами. После небольшого исследования кажется, что эта может быть проблемой, происходящей от Lotus-1-2-3 и системы, которую сторонняя сторона использовала для создания этого набора данных.
Некоторые из вещей, которые я пробовал:
- анализ столбца как даты при импорте как csv с pandas, а затем с использованием pd.to_datetime ()
- Использование pd.to_datetime без синтаксического анализа столбца как строки
- Многие другие, но с двумя вышеперечисленными попытками и просмотром необработанных данных это почти похоже на то, что сама информация отсутствует в значении, и только Excel может ее прочитать
Можно ли использовать это поле времени в Python? К сожалению, набор данных слишком велик для открытия в Excel, иначе я бы просто укусил пулю и правильно отформатировал число там.