Я объединяю несколько файлов xlsx, используя pd.concat()
.У меня есть 7 столбцов даты с пользовательским форматированием в файле Excel.Когда я объединяю файлы, вместо сохранения исходных дат все даты меняются на сегодняшние.Буду признателен за вашу помощь.Столбцы, содержащие даты, заданные индексами.
Вот код, который я использую:
import csv
import glob
import sys
import pandas as pd
import os
os.chdir(r"path")
all_files = glob.glob(os.path.join(path, "*.xlsx"))
header=['header names']
df = (pd.read_excel(f, sheet_name=0, skiprows=2, usecols='A:DN', sort=False,
header=None, names=header, infer_datetime_format=False,
format='%m/%d/%Y', parse_dates=[0,1,2,3,4,5,6,28],
start='01/01/1987', end='01/01/2019',
converters={'Initial Warrant Call Date':'datetime64[ns]',
'Trade Date':'datetime64[ns]',
'Overallotment Exercise Date':'datetime64[ns]',
'Filing Date':'datetime64[ns]',
'Issue Date':'datetime64[ns]',
'Date Filing Amended':'datetime64[ns]',
'Date Founded':'datetime64[ns]'})
for f in all_files)
concatenated_df = pd.concat(df, ignore_index=True)
concatenated_df.to_csv('merged_ipo.csv', encoding='utf-8', index=False)
Вывод: снимок сцепленного df.