В csv нулевые символы можно настроить, просто указав в DDL row format delimited null defined as $
.
Это собственное свойство существует только для файлов с разделителями. Итак, я ищу способ настроить то же самое в паркетных таблицах.
Кроме того, добавление в этот улей не вызывает никаких ошибок при добавлении этого в паркетный DDL. Итак, это действительно:
row format delimited by $
stored as PARQUET
Но на самом деле это не работает.
С другой стороны, spark- sql имеет утверждения, запрещающие это поведение и генерирует недопустимые исключения операции.