Возникла проблема с символами новой строки в файле json в таблице кустов - PullRequest
0 голосов
/ 05 октября 2018

На самом деле я пытаюсь загрузить файл JSON в таблицу кустов.Этот файл json содержит символы новой строки, из-за чего одна запись в таблице кустов хранится в виде двух строк.

Я использовал jsonserde здесь, чтобы вставить файл json в таблицу кустов.Этот serde не обрабатывает проблему символа новой строки.

Мое утверждение создания:

CREATE EXTERNAL TABLE sample_table(
    gender STRING, name STRING
)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
LOCATION '/user/input/sample' ;

Проведя исследование через Интернет, я нашел одно решение, т. Е. Установив «hive.query.result»..fileformat "в SequenceFile в hive-site.xml.

Я также установил указанное выше свойство с SequenceFile, используя Ambari.Но, все еще сталкиваясь с той же проблемой.

И я нашел еще одно свойство в файле hive-site.xml, т. Е. «Hive.default.fileformat», которое по умолчанию установлено в «TextFile».Мне тоже нужно поменять это свойство?

Может кто-нибудь помочь мне с тем же ...

...