Определить нулевой символ для паркетных столов в hive / spark- sql - PullRequest
0 голосов
/ 27 мая 2020

В csv нулевые символы можно настроить, просто указав в DDL row format delimited null defined as $.

Это собственное свойство существует только для файлов с разделителями. Итак, я ищу способ настроить то же самое в паркетных таблицах.

Кроме того, добавление в этот улей не вызывает никаких ошибок при добавлении этого в паркетный DDL. Итак, это действительно:

row format delimited by $ stored as PARQUET

Но на самом деле это не работает.

С другой стороны, spark- sql имеет утверждения, запрещающие это поведение и генерирует недопустимые исключения операции.

...