Я создал временную таблицу кустов поверх текстового файла следующим образом:
CREATE EXTERNAL TABLE tc (fc String,cno String,cs String,tr String,at String,act String,wa String,dn String,pnm String,rsk String,ttp String,tte String,aml String,pn String,ttn String)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ‘,’
STORED AS TEXTFILE
location '/home/hbaseuser/tc';
Затем я создал таблицу ORC следующим образом:
CREATE EXTERNAL TABLE tc1 (fc String,cno String,cs String,tr String,at String,act String,wa String,dn String,pnm String,rsk String,ttp String,tte String,aml String,pn String,ttn String)
Row format delimited
Fields terminated by '\t'
STORED AS orc
location '/user/hbaseuser/tc1';
Затем я использовал эту команду для импортаданные в таблицу кустов:
insert overwrite table tc1 select * from table tc;
теперь файл orc доступен на '/user/hbaseuser/tc1'
, и я могу читать из таблицы orc.
мой вопрос заключается в том, как использовать формат тега Rowserde 'org.apache.hadoop.hive.contrib.serde2.ORCSerDe'