Я хотел бы объединить несколько файлов CSV (разделитель ";") в каталоге и вывести их в один файл CSV с любым другим ";" с разделителем или с ",". Все CSV-файлы имеют одинаковое количество заголовков (заголовки должны оставаться), и они называются одинаково во всех CSV-файлах. Но их содержимое может содержать дубликаты, которые я хочу удалить.
Файлы могут иметь размер до 20 МБ.
Файлы начинаются с одинакового имени, но различаются в конце (в * который заменяет их
import csv
import glob
import pandas
stock_files = sorted(glob(r'C:\Users\urale\Desktop\logs\pc_dblatmonstat_*_*.log'))
print(stock_files)
files = [stock_files]
final_headers = [
'Start Time',
'epoch',
'Host Name',
'Db Alias',
'Database',
'Db Host',
'Db Host IP',
'IP Port',
'Latency (us)'
]
merged_rows = set()
for f in files:
with open(f, 'rb') as csv_in:
csvreader = csv.reader(csv_in, delimiter=';')
headers = dict((h, i) for i, h in enumerate(csvreader.next()))
for row in csvreader:
merged_rows.add(tuple(row[headers[x]] for x in final_headers))
with open('output.csv', 'wb') as csv_out:
csvwriter = csv.writer(csv_out, delimiter=',')
csvwriter.writerows(merged_rows)
Но я получаю сообщение об ошибке
Line6: Exception has occurred: TypeError
'module' object is not callable
Могу ли я получить совет, отражает ли мой код мой запрос и почему я получить ошибку?