почему бы вам не записать фрейм данных в файл напрямую.
использовать приведенный ниже код для записи фрейма данных, разделенных каналом, в файл:
mydf.coalesce(1)
.write
.option("header","true")
.option("sep","|")
.mode("overwrite")
.csv("output/path")
для преобразования фрейма данных в rdd, просто используйте mydf.rdd