Как загрузить XML-файл из hdfs в таблицу hbase - PullRequest
0 голосов
/ 22 февраля 2019

У меня есть XML-файл в HDFS, я хочу загрузить эти XML-файлы в таблицу HBase.

Я ссылался на некоторые ссылки, они используют опцию карты, чтобы загрузить данные XML в HBase,есть любая альтернативная опция, доступная для загрузки непосредственно в таблицу HBase.

1 Ответ

0 голосов
/ 22 февраля 2019

Я привел пример использования загрузки файла input3.xml с использованием PIG в HBASE.

=== input3.xml =====
<document>   
<url>htp://www.abc.com/</url>
<category>Sports</category>
<usercount>120</usercount>
<reviews>    
<review>good site</review>
<review>This is Avg site</review>
<review>Bad site</review>
</reviews>
</document>



A = LOAD'input3.xml' using 
   org.apache.pig.piggybank.storage.XMLLoader('document').HBaseStorage as 
   (data:chararray);

 B = foreach A GENERATE FLATTEN(REGEX_EXTRACT_ALL(data,'(?s)<document>.*?<url> 
 ([^>]*?)</url>.*?<category>([^>]*?)</category>.*?<usercount>([^>]*?)</usercount>.*? 
  <reviews>.*?<review>\\s*([^>]*?)\\s*</review>.*?</reviews>.*?</document>')) as 
  (url:chararray,catergory:chararray,usercount:int,review:chararray);
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...