Предположим, у меня есть набор данных df, как в следующем
col1 col2
1 A
1 B
1 C
2 B
2 B
2 C
Я хочу получить набор данных с col1 и сделать col2 массивом, используя следующий код
var df2=df.groupBy("col1").agg(collect_set("col2").alias("col2"))
тогда df2 будет
COl1 Col2
1 A,B,C
2 B,C
Как изменить код, чтобы я мог иметь
COl1 Col2
1 A,B,C
2 B,B,C