Я хотел бы удалить двойные кавычки "", когда значение пусто при регистрации моего CSV в S3 с помощью метода df.write.save () Spark
Версия Spark: 2.4.0
Python Версия: 3.6.5
Вот мой код на Python для загрузки файла CSV:
df = spark.read.load(
path('in'),
format = 'csv',
delimiter = '|',
encoding = 'utf-8',
header = 'true'
)
Загруженный файл CSV:
|id|first_name|last_name|zip_code|
|1 | |Elsner |57315 |
|2 |Noelle | | |
|3 |James |Moser |48256 |
Вот мой код в Python для записи файла CSV:
df.write.save(
path('out'),
format = 'csv',
delimiter = '|',
header = 'true'
)
В файле CSV написано:
|id|first_name|last_name|zip_code|
|1 |"" |Elsner |57315 |
|2 |Noelle |"" |"" |
|3 |James |Moser |48256 |
Как убрать двойную кавычку при регистрации?
Заранее большое спасибо.