Сбор значений по нескольким полям для данного ключа - Apache Spark (Scala) - PullRequest
0 голосов
/ 14 марта 2019

У меня есть фрейм Scala Data в следующем формате:

enter image description here

Мне нужно o / p в следующем формате:
enter image description here

o / p необходимо записать в файл json.

1 Ответ

0 голосов
/ 14 марта 2019

Вот оно. Измените форматирование в соответствии с вашими потребностями.

import org.apache.spark.sql.functions._
df.withColumn("arr", format_string("{%d,%d,%d}", $"pd_id", $"score",$"rank"))
.groupBy("event_tra", "customer", "itemId", "ckey").agg(collect_list("arr").as("collection"))
.select(format_string("{%s,%s,%s,%s,%s,%s}", $"event_tra", $"customer", $"itemId", $"ckey", col("collection").toString).as("data"))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...