Как разбить столбец на список и сохранить его в новый файл .csv - PullRequest
0 голосов
/ 16 марта 2020

У меня есть фрейм данных с двумя столбцами: студенческий билет и их курсы. Столбец курса имеет несколько значений, разделенных «;». Как разделить жанры на список и сохранить каждую пару (studentID, genre1), (studetID, genre2) в новый файл CSV?

1 Ответ

1 голос
/ 16 марта 2020

Вы можете попробовать split и explode:

  val df =  Seq((1,("a;b;c"))).toDF("id","values")
  df.show()

  val df2 = df.select($"id", explode(split($"values",";")).as("value"))
  df2.show()

  df2.write.option("header", "true").csv("/path/to/csv");

+---+------+
| id|values|
+---+------+
|  1| a;b;c|
+---+------+

+---+-----+
| id|value|
+---+-----+
|  1|    a|
|  1|    b|
|  1|    c|
+---+-----+
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...