Чтобы заменить возврат каретки, перевод строки и табуляцию, вы можете использовать \s
\ s = [\ t \ n \ r \ f \ v]
Во всех ваших столбцах фрейма данных есть код pyspark, который вам необходим для замены:
from pyspark.sql import functions as F
df = spark.createDataFrame([("\ttext1", 'text2\n', 'te\rxt3'), ("text1\t", '\ntext2', 't\rext3')], ['col1', 'col2', 'col3'])
expr = [F.regexp_replace(F.col(column), pattern="\s+", replacement=",").alias(column) for column in df.columns]
df.select(expr).show()
+------+------+------+
| col1| col2| col3|
+------+------+------+
|,text1|text2,|te,xt3|
|text1,|,text2|t,ext3|
+------+------+------+