Я пытаюсь удалить указанный символ c из строки, но не могу найти правильного решения. Не могли бы вы помочь мне, как это сделать?
Я загружаю данные в dataframe с помощью pyspark. Один из столбцов с дополнительным символом, который я хочу удалить.
Пример:
|"\""warfarin was discontinued 3 days ago and xarelto was started when the INR was 2.7, and now the INR is 5.8, should Xarelto be continued or stopped?"|
Но в результате я хочу только:
|"warfarin was discontinued 3 days ago and xarelto was started when the INR was 2.7, and now the INR is 5.8, should Xarelto be continued or stopped?"|
Я использую код ниже для записи фрейма данных в файл:
df.repartition(1).write.format('com.databricks.spark.csv').mode('overwrite').save(output_path, escape='\"', sep='|',header='True',nullValue=None)