У меня есть следующий фрейм данных:
val df = Seq(
("A", 2.0),
("A", 1.5),
("B", 8.0),
("B", 9.0)
).toDF("id", "val")
Я хотел бы создать группу и для каждой группы на основе уникального идентификатора 1. иметь счетчик бегов, т.е. первый равен 0, второй равен 12. общее количество внутри группы.
должно выглядеть как
+---+---+---+---+
| id|val|order|count|
+---+---+---+---+
| A|2.0|0 |2
| A|1.5|1 |2
| A|2.5|2 |2
| B|8.0|0|2
| B|9.0|1 |2
+---+---+
Я не вижу, как это сделать с помощью spark sql или функций.