У меня есть программа, в которой я пишу файл с разделителями каналов, используя PySpark. Я хочу записать файл, используя Ç - cedilla в качестве разделителя.
образец кода
separator = '|'
concat_udf1 = F.udf(lambda cols: "".join([x+separator if x is not None else "separator" for x in cols]), StringType())
Текущий вывод данных
7|2020-03-31|xyz
7|2020-03-31|abc
Новый вывод данных
7Ç2020-03-31Çxyz
7Ç2020-03-31Çabc
Если я меняю разделитель на Ç - cedilla, я получаю ошибку ниже
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 0: ordinal not in range(128)
Любая помощь приветствуется - TIA