У меня есть ряд фреймов данных, который выглядит следующим образом:
a b r
1 43 630 587
d b c
1 34 30 87
Я хочу создать новый фрейм данных, который выглядит как
1005 *
Я использовал код -
appended_data= pd.concat(appended_data, axis=0)
, где список appended_data содержит отдельные серии данных в качестве элементов.Ранее, когда я использовал его с другим набором данных, он не выдавал никакой ошибки, но с новым набором данных его показ ValueError: Plan shapes are not aligned
Примечание-Ранее набор данных также имел дублирующиеся столбцы, и тогда он работал нормально, и я также обновил pandas.решения, которые я нашел в Интернете.
полный код-
dir_list = [benign_freq_dir,malign_freq_dir]
appended_data = []
for l in dir_list:
for root, dirs, files in os.walk(l):
#print(root)
for name in files:
file = open(root+"/"+name,'r')
print(name)
print("\n")
df = pd.read_csv(file,header=None,error_bad_lines=False) #In windows and python3 always pass file object not the path directly in pd.read_csv
#print(df)
df = df.rename(columns={0: 'col'})
#print(df)
df = pd.DataFrame(df.col.str.split(' ',1).tolist(), columns = ['col1','col2']).T.reset_index(drop=True)
df = df.rename(columns=df.iloc[0]).drop(df.index[0])
print(df)
appended_data.append(df)
if l==benign_freq_dir:
df['class']=0
else:
df['class']=1
#for l in appended_data:
# print(l)
# print(type(l))
appended_data= pd.concat(appended_data, axis=0,sort=False)

edit-
вывод для-
for dfx in appended_data:
print(dfx.head(2).to_dict())
