Доступ к дате из отформатированных во времени ячеек CSV, содержащих datetime - PullRequest
0 голосов
/ 06 декабря 2018

У меня есть несколько сотен CSV-файлов, все с датой и временем в одном и том же столбце (имя не проиндексировано).Когда я открываю их как CSV в Excel, все ячейки отображают время (мм: сс.ф), но, выделяя ячейку, я вижу, что у них полная дата и время.

Example of time being displayed but full datetime being present

Я объединяю несколько сотен этих файлов, используя Pandas (и удаляю дубликаты, и отбрасываю пустые строки):

files = glob.glob("in(*).csv") 
df = pd.concat((pd.read_csv(f, header = 0) for f in files))
df.drop_duplicates()
df['accountno'].replace('', np.nan, inplace=True)
df.dropna(subset=['accountno'], inplace=True)
df.to_csv("out.csv")

Но выходной файл больше не имеет полное время и только форматированное времядля отображения в Excel.

Example of datetime no longer being present

Я могу вручную войти и изменить форматирование, что приводит к переносу даты в выходной файл, но это происходит сотни раз.многократные случаи кажутся немного утомительными ...

Есть ли способ получить доступ к дате, а не только к отображаемому времени при чтении файла в python?Или, альтернативно, способ программно изменить форматирование всех файлов до даты, а не времени?

РЕДАКТИРОВАТЬ: я попытался добавить аргумент parse_dates=['saledt'] в функцию pd.read_csv (), но он бросилValueError: 'saledt' is not in list ошибка

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...