У меня есть датафрейм df. В котором у нас есть order_date, мне нужно просканировать годы из столбца даты (с использованием разделения) и сравнить его с конечным годом, если он совпадает, затем назначить его @i, а затем увеличить год окончания. Я добавил df, чтобы показать putput ожидается
df
df:
df[order_date] = 1/2/2020
df[st_yr] = 2020
df[ed_yr] = df[st_yr] + 1
do i = 1 to 5
if df.withColumn("order_date", split(col("order_date"), "/").getItem(2)) = df[ed_yr]
df[st_yr] = i;
df[ed_yr] = df[ed_yr] + 1
end