Используйте метод spark.read.text()
и параметр In, сохраните свой собственный lineSep
spark.read.option("lineSep", '~$|').text('<filepath>').withColumn("value",regexp_replace(col("value"),'\n','')).show()
#+------------------+
#| value|
#+------------------+
#| Raj India 1000 |
#| John Canada 2000 |
#| Steve USA 3000 |
#| Jason USA 4000|
#+------------------+
После создания фрейма данных используйте функцию split
для значения column для создания новых столбцов в фрейме данных с помощью функций .getItem
, element_at
.