unit_data = pd.read_csv("유닛.csv")
item_data = pd.read_csv("아이템.csv")
trait_data = pd.read_csv("시너지.csv")
#중복이 없는 기준열 만들기
unq_unit1_dt = unit_data['1st-unit'].drop_duplicates()
unq_unit2_dt = unit_data['2nd-unit'].drop_duplicates()
unq_unit3_dt = unit_data['3rd-unit'].drop_duplicates()
unq_item_dt = item_data['0'].drop_duplicates()
unq_trait_dt = trait_data['0'].drop_duplicates()
#저장할 리스트
unit1_d= {};s_u1_d = {};u1_L = []
unit2_d = {};s_u2_d = {};u2_L = []
unit3_d = {};s_u3_d = {};u3_L = []
s_u_d = {};u4_L = []
item_d = {};s_i_d = {};key_L = []
trait_d = {};s_t_d = {};trait_L = []
#unit_data분석
for i in unq_unit1_dt:
a = unit_data['1st-unit'].count(i)
unit1_d[str(i)] = a
a = 0
for j in unq_unit2_dt:
b = unit_data['2nd-unit'].count(j)
unit2_d[j] = b
b = 0
for h in unq_unit3_dt:
c = unit_data['3rd-unit'].count(h)
unit3_d[h] = c
c = 0
#데이터 정렬 후 값 추출
s_u1_d = sort_dict(unit1_d); u1_df = pd.DataFrame(s_u1_d); u1_df.to_csv("유닛1.csv", index=False,encoding = 'cp949')
s_u2_d = sort_dict(unit2_d); u2_df = pd.DataFrame(s_u2_d); u2_df.to_csv("유닛2.csv", index=False,encoding = 'cp949')
s_u3_d = sort_dict(unit3_d); u3_df = pd.DataFrame(s_u3_d); u3_df.to_csv("유닛3.csv", index=False,encoding = 'cp949')
for i in range(5):
u1_L.append(list(s_u1_d.keys)[i])
u2_L.append(list(s_u2_d.keys)[i])
u3_L.append(list(s_u3_d.keys)[i])
s_u_d = {'1st-sorted':u1_L, '2nd-sorted':u2_L, '3rd-sorted':u3_L}
s_u_df = pd.DataFrame(s_u_d)
s_u_df.to_csv("유닛추천.csv",index=False,encoding = 'cp949')
#item sort
for i in unq_item_dt:
item_d[i] = item_data.count(i)
s_i_d = sort_dict(item_d)
s_i_df = pd.dataFrame(s_i_d)
s_i_df.to_csv("아이템정렬.csv",index=False,encoding = 'cp949')
#item 결과 추출
for i in range(3):
key_L.append(list(s_i_d.keys)[i])
p_i_df = pd.DataFrame(key_L)
p_i_df.to_csv("추천아이템코드.csv",index=False,encoding = 'cp949')
#trait sort
for i in range(len(unq_trait_dt)):
trait_d[unq-trait_dt[i]] = trait_data.count(unq-trait_dt[i])
s_t_d = sort_dict(trait_d)
s_t_df = pd.DataFrame(s_t_d)
s_t_df.to_csv("시너지정렬.csv",index=False,encoding = 'cp949')
#trait 결과 추출
for i in range(3):
trait_L.append(list(s_t_d.keys)[i])
p_t_df = pd.DataFrame(trait_L)
p_t_df.to_csv("추천시너지.csv",index=False,encoding = 'cp949')
<ipython-input-80-f08a724d44c7> in <module>
89 return s_u_df, s_i_df, p_i_df, s_t_df, p_t_df
90
---> 91 print(analyze_data())
92
93
<ipython-input-80-f08a724d44c7> in analyze_data()
63 #item sort
64 for i in unq_item_dt:
---> 65 item_d[i] = item_data.count(i)
66 s_i_d = sort_dict(item_d)
67 s_i_df = pd.dataFrame(s_i_d)
~\anaconda3\lib\site-packages\pandas\core\frame.py in count(self, axis, level, numeric_only)
7782 Myla 1
7783 """
-> 7784 axis = self._get_axis_number(axis)
7785 if level is not None:
7786 return self._count_level(level, axis=axis, numeric_only=numeric_only)
~\anaconda3\lib\site-packages\pandas\core\generic.py in _get_axis_number(cls, axis)
405 except KeyError:
406 pass
--> 407 raise ValueError(f"No axis named {axis} for object type {cls}")
408
409 @classmethod
ValueError: No axis named 44 for object type <class 'pandas.core.frame.DataFrame'>
Это мой код и ошибка
он должен получать данные из 3 файлов csv и получать то, что больше всего дублируется в данных
Я хотел добавить ключ: значение для dict, но эта ошибка происходит, и я считаю, что есть еще ....
, так как это мой первый раз, когда я использовал python для своей работы, есть много ошибок, и я использовал очень нуб 유닛 .csv si 4646X3 아이템 .csv и 시너지 .csv имеет только один столбец