С динамической генерацией столбцов хорошо работает следующее:
import org.apache.spark.sql.functions._
import sqlContext.implicits._
import org.apache.spark.sql.DataFrame
val input = sc.parallelize(Seq(
("a", "5a", "7w", "9", "a12", "a13")
)).toDF("ID", "var1", "var2", "var3", "var4", "var5")
val columns_to_concat = input.columns
input.select(concat(columns_to_concat.map(c => col(c)): _*).as("concat_column")).show(false)
возвращает:
+-------------+
|concat_column|
+-------------+
|a5a7w9a12a13 |
+-------------+
Как это сделать с foldLeft, reduLeft - покасохранение динамической генерации столбца?
Я всегда получаю либо ошибку, либо возвращаемое нулевое значение.Хотя concat достаточно, мне любопытно, как складчатость и т. Д. Может работать.