pyspark hive - вставить NULL как DB null через текстовый файл - PullRequest
0 голосов
/ 26 мая 2020

При вставке текстового файла из оболочки pyspark в таблицу hive .

Значения NULL рассматриваются как строка в таблице.

Если я запрашиваю таблицу куста, записи можно повторить только с условием фильтрации = 'NULL', а не is null.

Может ли кто-нибудь предложить, как вставить данные как DB NULLS в таблицу

1 Ответ

0 голосов
/ 26 мая 2020

Проверьте, имеет ли ваш фрейм данных Spark значение null или None. И при записи в таблицу куста установите для параметра nullValue значение

df.write.option('nullValue', None).saveAsTable(path)

. Это решит вашу проблему.

...