У меня есть датафрейм, в котором я хочу дать идентификаторы в каждом разделе Window. Например, у меня есть
id | col |
1 | a |
2 | a |
3 | b |
4 | c |
5 | c |
Итак, я хочу (на основе группировки по столбцу col)
id | group |
1 | 1 |
2 | 1 |
3 | 2 |
4 | 3 |
5 | 3 |
Я хочу использовать оконную функцию, но все равно не могу найти, чтобы назначить Id для каждого окна. Мне нужно что-то вроде:
w = Window().partitionBy('col')
df = df.withColumn("group", id().over(w))
Есть ли способ достичь чего-то подобного. (Я не могу просто использовать col в качестве идентификатора группы, потому что я заинтересован в создании окна из нескольких столбцов)