Я пытаюсь прочитать и превзойти файл, сохранить его и начать процесс очистки.
def read_data(path1,path2,path3,path4):
questions_index_data=pd.read_excel(path2)
enterprises_data=pd.read_excel(path3)
historical=pd.read_excel(path4)
adjusted_questions_data=pd.read_excel(path1)
return questions_index_data,enterprises_data,historical,adjusted_questions_data
# In[106]:
def validation_1_process(adjusted_questions_data):
validation_1=(adjusted_questions_data[(adjusted_questions_data.Tipo=="Rango 1 a 5")&(adjusted_questions_data.Valor.isin(range(1,6)))]
.reindex(columns=["Correo electrónico","Empresa evaluada","Pregunta","Valor"]))
validation_1.Valor=validation_1.Valor.astype(int)
quantile75=validation_1.groupby(["Correo electrónico","Empresa evaluada","Pregunta"]).quantile(0.75)
quantile25=validation_1.groupby(["Correo electrónico","Empresa evaluada","Pregunta"]).quantile(0.25)
quantiles=(quantile25.rename(columns={"Valor":"Q25"}).reset_index()
.merge(quantile75.rename(columns={"Valor":"Q75"}).reset_index(),
how="left", on=["Correo electrónico","Empresa evaluada","Pregunta"]))
validation_1=validation_1.merge(quantiles, how="left", on=["Correo electrónico","Empresa evaluada","Pregunta"])
validation_1=validation_1.assign(Outlier_1= lambda x: np.where((x.Valor<x.Q25-1.5*(x.Q75-x.Q25))|
x.Valor>x.Q75+1.5*(x.Q75-x.Q25),1,0))
validation_1.Outlier_1=validation_1.Outlier_1.fillna(0)
return validation_1
Я получаю ошибку AttributeError: у объекта 'str' нет атрибута 'Tipo'