Не могли бы вы сначала попробовать использовать rdd, переформатировать его, а затем создать поверх него фрейм данных.
df = sc.textFile(PATH_TO_FILE) \
.map(lambda x: x.replace("\\," ,"|")) \
.mapPartitions(lambda line: csv.reader(line,delimiter=','))\
.filter(lambda line: line[0] != 'Name') \
.toDF(['Name','Age','Address','Salary'])
вот так выглядит ваш фрейм данных:
>>> df.show();
+----+---+----------------+------+
|Name|Age| Address|Salary|
+----+---+----------------+------+
|Luke| 24|Mountain View|CA| 100|
+----+---+----------------+------+
Я должен заменить адресную колонку "\," на "|"и затем я разделил данные, используя разделитель ','.Не уверен, насколько это соответствует вашим требованиям, но он работает.