Из одного огромного файла я создал папку, в которой хранятся различные CSV-файлы на основе значения IDMember
.
import os, glob
import pandas as pd
# reading the csv file
df = pd.read_csv(r'path_of_my_dataframe')
# removing duplicates in IDMember column in order to identify with which ids we should be dealing (which ids are unique)
df1 = df['IDMember'].drop_duplicates(keep= 'first')
for elem in df1:
df1= df.loc[df['IDMember'] == elem]
#print (df1)
df1.to_csv(str(elem)+".csv")
print ("CSVs created!")
Следующим шагом является создание Excel для каждого из этих CSV, я пытался что-то вроде этого, что не работает:
myFolder = r"path_where_i_want_to_extract_excel_files"
# Create a list to store all the csv files in the folder
os.chdir(myFolder)
csvList = glob.glob('*.csv')
print (csvList)
for elem in csvList:
df_csv = pd.read_csv(elem)
print(elem)
df_csv.to_excel(str(elem)+".xlsx")
У меня есть эта ошибка: "UnicodeDecodeError : код utf8 c не может декодировать байт 0xc7 в позиции 14: недопустимый байт продолжения "