Я читал исправленное с файлом из файла oop, делал substr и преобразовывал его в файл с разделителями. Код работает нормально, но вместо пустых значений в случае нуля он возвращает \ "\". Не могли бы вы предложить?
фрагмент
df.select(
df.value.substr(31, 1).alias('status'),
df.value.substr(32, 1).alias('tin_cert'),
df.value.substr(116, 1).alias('c_notice_flg'),
df.value.substr(117, 2).alias('nbr_non_prime_trlrs'),
df.value.substr(119, 3).alias('aw_related')
).write.option("delimiter", "|").csv(unixFile)
output
| \ "\" | 0 | N | 00 | \ "\" | 199 |
желаемый вывод
|| 0 | N | 00 || 199 |
без кавычек во входном файле
000000000014999999999 281AAAA AAAAAAA AAAA 1NN00
000000000024 200BBBBBB BBBBBBBBBBBBBBBBB 0NN00
000000000034 200 0NN00
000000000044 200 0NN00