Я импортировал файл CSV, используя read_csv.Необработанные данные в столбце CSV, который меня интересует, записывают дату в следующем формате:
19/01/2012 9:00:00 AM
Однако, когда данные импортируются, они отображаются как:
2005-03-21 10:30:00
Не уверен, почему это происходит.В конечном итоге меня интересует извлечение даты (19/01/2012) и ее использование для расчета количества дней, отличных от самой ранней даты в столбце.Что-то вроде ...
df['date_column'] = (df['date_column'] - df['date_column'].min())
Я попробовал пару вещей, во-первых:
df['date_column'] = pd.to_datetime(df['date_column'], dayfirst=True)
Это возвращает тот же формат даты, как показано выше.А именно 2005-03-21 10:30:00
Вторая попытка была попытаться
df['date_column'] = pd.to_datetime(df['date_column'], format ='%d-%m-%y %I:%M:%S %p')
Это дало мне ошибку
ValueError: time data '2004-03-16 11:40:00 'не соответствует формату'% d-% m-% y% I:% M:% S% p '(соответствует)
Я пробовал несколько незначительных изменений ввыше.Я использую Jupyter v 5.7.4 под управлением Python 3.7.1
Конечно, буду признателен за любой совет / помощь!Спасибо.