Дело в том, что у меня есть два одинаковых выхода, один текстовый (CTR + A разделенный), а второй паркетный.
С загрузкой паркетного выхода в pyspark проблем нет.Есть значения или они пустые (реальный пробел не нулевой).
но при выводе текста это выглядит так:
вместо пустых значений есть "ноль" (я почти уверен).
Я загружаю вывод текста следующим образом:
df_t = spark.read \
.schema(customSchema) \
.option('quote', '\u0000') \
.option('delimiter', '\u0001') \
.option('header', 'false') \
.option('nullValue', '{{null}}') \
.csv(path_t)
Я думал, что с этой опцией будет какой-то эффект:
.option('nullValue', '{{null}}') \
, но его нет.
Есть ли какая-нибудь опция, которая могла бы справиться с этим?