Question

Дело в том, что у меня есть два одинаковых выхода, один текстовый (CTR + A разделенный), а второй паркетный.

С загрузкой паркетного выхода в pyspark проблем нет.Есть значения или они пустые (реальный пробел не нулевой).

но при выводе текста это выглядит так:

вместо пустых значений есть "ноль" (я почти уверен).

Я загружаю вывод текста следующим образом:

df_t = spark.read \
   .schema(customSchema) \
   .option('quote', '\u0000') \
   .option('delimiter', '\u0001') \
   .option('header', 'false') \
   .option('nullValue', '{{null}}') \
   .csv(path_t)

Я думал, что с этой опцией будет какой-то эффект:

.option('nullValue', '{{null}}') \

, но его нет.

Есть ли какая-нибудь опция, которая могла бы справиться с этим?

Как правильно загрузить вывод текста (CTRL + отдельные и пустые значения) в pyspark?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как правильно загрузить вывод текста (CTRL + отдельные и пустые значения) в pyspark?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов