Apache Spark, как добавить новый столбец из списка / массива в информационный фрейм Spark - если в информационном фрейме есть несколько столбцов - PullRequest
0 голосов
/ 09 ноября 2019

Как можно получить одинаковый результат со всеми столбцами в df, если if является многостолбцовым df. Пример: все столбцы из df дополнены строкой 2.

val list = List(4,5,10,7,2)
val df   = List("a","b","c","d","e").toDF("row1")

df.collect()
  .map(_.getAs[String]("row1"))
  .zip(list).toList
  .toDF("row1", "row2")

@ Цах Зохар, вы отвечаете, работает хорошо, но потребуются некоторые незначительные изменения.

https://stackoverflow.com/a/44396289/10203846

СсылкаСсылка: Apache Spark, как добавить новый столбец из списка / массива в фрейм данных Spark

Решение, предложенное @Psidom, дает следующую ошибку: Исключение в потоке "main" java.lang.IllegalArgumentException:Не удается заархивировать RDD с неравным количеством разделов: List (5, 8) в org.apache.spark.rdd.ZippedPartitionsBaseRDD.getPartitions (ZippedPartitionsRDD.scala: 57)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...