Я работаю над набором данных с более чем 10 миллионами строк. В рамках процесса разработки данных я хочу обновить столбец, если выполняется условие в двух других столбцах.
Я сделал это следующим образом, но из-за большого количества записей выполнение заняло много времени.
for i in df1.index:
val1, val2= 0,0
val1 = df1.iat[i,6]
val2 = df1.iat[i,7]
if val1 < 270.37 and val2 < 2.5:
df1.at[i,'ppt_type']= 1
elif val1<270.37 and val2>=2.5 and val2<7.6:
df1.at[i,'ppt_type']=2
else:
df1.at[i,'ppt_type']= 3
Пожалуйста, предложите методы, в которых значение столбца может быть эффективно обновлено.
Спасибо.