У меня есть особое требование, чтобы заполнить все значения (категории) в столбце.Например, как показано в таблице ниже.Я хочу заполнить категории «НЕИЗВЕСТНО» и «НАЗНАЧЕНО» для кода HL_14108.
val df = Seq(
("HL_13203","DELIVERED",3226),
("HL_13203","UNSEEN",249),
("HL_13203","UNDELIVERED",210),
("HL_13203","ASSIGNED",2),
("HL_14108","DELIVERED",3083),
("HL_14108","UNDELIVERED",164),
("HL_14108","PICKED",1)).toDF("code","status","count")
Ввод:
+--------+-----------+-----+
| code| status|count|
+--------+-----------+-----+
|HL_13203| DELIVERED| 3226|
|HL_13203| UNSEEN| 249|
|HL_13203|UNDELIVERED| 210|
|HL_13203| ASSIGNED| 2|
|HL_14108| DELIVERED| 3083|
|HL_14108|UNDELIVERED| 164|
|HL_14108| PICKED| 1|
+--------+-----------+-----+
Ожидаемый вывод:
+--------+-----------+-----+
| code| status|count|
+--------+-----------+-----+
|HL_13203| DELIVERED| 3226|
|HL_13203| UNSEEN| 249|
|HL_13203|UNDELIVERED| 210|
|HL_13203| ASSIGNED| 2|
|HL_13203| PICKED| 0|
|HL_14108| DELIVERED| 3083|
|HL_14108|UNDELIVERED| 164|
|HL_14108| PICKED| 1|
|HL_14108| UNSEEN| 0|
|HL_14108| ASSIGNED| 0|
+--------+-----------+-----+
Я хочу добавить недостающие строки категорий для каждого кода.Какой будет правильный подход, чтобы сделать это в Apache Spark?