например у меня есть этот тип DataFrame:
val DF = Seq((10, "id1",1),
(20, "id1",6),
(30, "id1",6),
(40, "id1",11),
(50, "id1",1),
(60, "id1",1),
(70, "id1",11),
(10, "id2",1),
(20, "id2",11),
(30, "id2",1),
(40, "id2",6),
(50, "id2",1),
(60, "id2",11),
(70, "id2",6)).toDF("Time", "ID","Channel")
+----+---+-------+
|Time| ID|Channel|
+----+---+-------+
| 10|id1| 1|
| 20|id1| 6|
| 30|id1| 6|
| 40|id1| 11|
| 50|id1| 1|
| 60|id1| 1|
| 70|id1| 11|
| 10|id2| 1|
| 20|id2| 11|
| 30|id2| 1|
| 40|id2| 6|
| 50|id2| 1|
| 60|id2| 11|
| 70|id2| 6|
+----+---+-------+
Я бы хотел для каждого идентификатора посчитать количество изменений значения Channel, с течением времени.
Чтобы получить результат как
+---+-----------------------+
| ID|NumberChannelChangement|
+---+-----------------------+
|id1| 4|
|id2| 6|
+---+-----------------------+
Я попытался преобразовать DataFrame в RDD и перебрать его.
Я не получаю один и тот же результат от одного прогона к другому, когда использую один и тот же ввод.
Заранее спасибо за помощь