Scala, столбец Dataframe, имеющий список значений, я хочу создать каждое значение как новый столбец и назвать его - PullRequest
0 голосов
/ 06 июня 2018

У меня есть столбец данных, указанный ниже.

House_No = INT
family_details = ["name" , age , "surname" , weight]
Ownership = Boolean

Я хочу создать новый столбец для данных с именем, возрастом, фамилией и весом.

House_No
family_details
Ownership
name
age
surname
weight

1 Ответ

0 голосов
/ 06 июня 2018

Ниже решение поможет вам:

     val data =  Array((2,Array("abc","23","xyz","70"),true),(3,Array("lmn","45","pqr","50"),false))

     val rdd = sc.parallelize(data)

     val df = rdd.toDF("house_no","family_details","ownership")

val res = df.select("house_no","ownership","family_details").withColumn("name", split($"family_details" (0), ",")(0)).withColumn("age", split($"family_details"(1), ",")(0)).withColumn("surmname", split($"family_details"(2), ",")(0)).withColumn("Weight", split($"family_details"(3), ",")(0)).drop("family_details")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...