Я новичок в pandas, поэтому, пожалуйста, помогите мне с этим вопросом. Я создал файл конкатенации из 5 файлов csv следующим образом:
import os
import glob
import pandas as pd
import csv
os.chdir(r"C:\Users\csv files")
extension = 'csv'
all_filenames = [i for i in glob.glob('*.{}'.format(extension))]
combined_csv = pd.concat([pd.read_csv(f) for f in all_filenames])
combined_csv.to_csv("combined_csv.csv", index=False, encoding='utf-8-sig')
Теперь я хочу работать с этим файлом, но когда я набираю какую-либо команду, например print(combined_csv.isnull().sum())
, программа запускается с самого начала, а мой уже созданный комбинированный файл csv добавляется дважды (мой комбинированный файл состоит из 8040 r aws, после этого он становится 16080 r aws), а затем дает результат требуемой команды combined_csv.isnull().sum()
.
Я понимаю, что это нормально, потому что я запускаю программу дважды, но есть ли способ решить эту проблему, не используя файл в качестве аргумента командной строки, может быть, что-то написать в коде? Спасибо за помощь.