Как заставить Hive работать с bz2? - PullRequest
0 голосов
/ 24 октября 2011

Поскольку bz2 разделяется и экономит место, я планирую хранить данные таблицы в формате bzip2. Однако кажется, что он не распознает сжатый формат. Это было хорошо с форматом GZIP. Код, который я использовал, выглядит следующим образом:

CREATE TABLE IF NOT EXISTS image_bzip (
    image_id STRING,
    image_feature STRING, 
    other_stuff STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE LOCATION '/hivestore/bzip';

LOAD DATA LOCAL INPATH '/nfs/directory/*.bz2' OVERWRITE INTO TABLE image_bzip;

Может кто-нибудь указать мне, что мне не хватает?

Спасибо.

Ответы [ 2 ]

1 голос
/ 18 ноября 2011

почему бы вам не попробовать создать внешнюю таблицу со сжатыми файлами bz2 в HDFS?

1 голос
/ 27 октября 2011

, если мы правильно установили кодек сжатия, он работает нормально.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...