Я пытаюсь загрузить файл с разделителями трубы в куст, сохраняя его в формате Parquet. Я получаю пробел во всех строках. Во входном файле с разделителями трубы нет пробелов ID-12345 Name-ADAM. Но его хранят с пробелами между ними. Это происходит для всех рядов.
ID
1 2 3 4 5
Имя
A D A M
Создать таблицу Состав:
ROW FORMAT SERDE
'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
WITH SERDEPROPERTIES (
'field.delim'='|',
'serialization.format'='|')
STORED AS INPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'