Я хотел бы создать столбец на моем фрейме данных spark с операциями над двумя столбцами.
Я хочу создать столбец Areas
, который рассчитывается по формуле:
( (Pct_Buenos_Acum[i]-Pct_Buenos_Acum[i-1]) * (Pct_Malos_Acum[i]+Pct_Malos_Acum[i-1]) ) / 2
Я пробовал это:
w = Window.rowsBetween(Window.unboundedPreceding, Window.currentRow)
df= df.withColumn('Areas', (( ( col('Pct_Acum_buenos')-col('Pct_Acum_buenos' ) )*(col('Pct_Acum_malos')+col('Pct_Acum_malos')))/2).over(w))
Найти прикрепленный отпечаток того, что у меня до сих пор