Как исправить пространство между значениями строк в таблице кустов, хранящихся в формате паркета? - PullRequest
0 голосов
/ 19 апреля 2019

Я пытаюсь загрузить файл с разделителями трубы в куст, сохраняя его в формате Parquet. Я получаю пробел во всех строках. Во входном файле с разделителями трубы нет пробелов ID-12345 Name-ADAM. Но его хранят с пробелами между ними. Это происходит для всех рядов.

ID 1 2 3 4 5

Имя A D A M

Создать таблицу Состав:

ROW FORMAT SERDE 
  'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe' 
WITH SERDEPROPERTIES ( 
  'field.delim'='|', 
  'serialization.format'='|') 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
...