Как преобразовать массив любого из элементов в dataframe в spark scala? - PullRequest
0 голосов
/ 28 июня 2019

У меня есть массив как Array[(Any, Any, Any)]. Например:

l1 =  [(a,b,c),(d,e,f),(x,y,z)]

Я хочу преобразовать его в Dataframe как:

c1    c2    c3
a     b     c
d     e     f
x     y     z

Я пытался преобразовать существующий фрейм данных в список:

val l1= test_df.select("c1","c2","c3").rdd.map(x => 
(x(0),x(1),x(2))).collect()
println (lst) 
val c = Seq(l1).toDF("c1","c2","c3") 
c.show()

Но выдает эту ошибку:

xception in thread "main" java.lang.ClassNotFoundException: scala.Any
at java.net.URLClassLoader.findClass(Unknown Source)
at java.lang.ClassLoader.loadClass(Unknown Source)

1 Ответ

0 голосов
/ 28 июня 2019

В Pyspark:

l1 =  [('a','b','c'),('d','e','f'),('x','y','z')]
sdf=spark.createDataFrame(l1)
sdf.show()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...