Показать сбой вызова с сгруппированным и агрегированным кадром данных - PullRequest
0 голосов
/ 26 июня 2019

Я пытаюсь использовать сумму после groupBy, например,

val b = a.groupBy($"key").agg(sum($"value"))

Здесь схема имеет следующий тип:

 |-- key: string (nullable = true)
 |-- value: integer (nullable = false)

В то время как схема bследующего типа,

 |-- key: string (nullable = true)
 |-- sum(value): long (nullable = true)

Но когда я делаю b.show, я получаю эту ошибку.

cannot assign instance of scala.collection.immutable.List$SerializationProxy 
to field org.apache.spark.rdd.RDD.org$apache$spark$rdd$RDD$$dependencies_ 
of type scala.collection.Seq in instance of org.apache.spark.rdd.MapPartitionsRDD

В чем может быть причина этой ошибки?Я использую Spark 2.3.2 и запускаю код с примечанием Apache Zeppelin.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...