Цикл в pyspark - PullRequest
       103

Цикл в pyspark

0 голосов
/ 09 мая 2020

У меня есть датафрейм df. В котором у нас есть order_date, мне нужно просканировать годы из столбца даты (с использованием разделения) и сравнить его с конечным годом, если он совпадает, затем назначить его @i, а затем увеличить год окончания. Я добавил df, чтобы показать putput ожидается

df

df:

    df[order_date] = 1/2/2020
    df[st_yr] = 2020
    df[ed_yr] = df[st_yr] + 1

    do i = 1 to 5
    if df.withColumn("order_date", split(col("order_date"), "/").getItem(2)) = df[ed_yr]
        df[st_yr] = i;
        df[ed_yr] = df[ed_yr] + 1
    end
...