Я пытаюсь сгруппировать фрейм данных, затем при агрегировании строк с количеством я хочу применить условие к строкам перед счетом.
Вот пример:
val test=Seq(("A","X"),("A","X"),("B","O"),("B","O"),("c","O"),("c","X"),("d","X"),("d","O")).toDF
test.show
+---+---+
| _1| _2|
+---+---+
| A| X|
| A| X|
| B| O|
| B| O|
| c| O|
| c| X|
| d| X|
| d| O|
+---+---+
в этом примере я хочу сгруппировать по столбцу _1 по счетчику по столбцу _2, когда значение = 'X'
вот ожидаемый результат:
+---+-----------+
| _1| count(_2) |
+---+-----------+
| A| 2 |
| B| 0 |
| c| 1 |
| d| 1 |
+---+-----------+