Как я могу вывести таблицу hbase в текстовый файл? - PullRequest
4 голосов
/ 11 октября 2011

Мне нужно взять дамп одной таблицы в HBase и он нужен в формате текстового файла / csv? Я искал команды scan, export и get в оболочке HBase, но она не работает.

Ответы [ 2 ]

3 голосов
/ 14 ноября 2011

Есть много способов получить данные из таблицы HBase, например, выполнить задание экспорта / сокращения. Вы можете прочитать об этом и других здесь http://blog.sematext.com/2011/03/11/hbase-backup-options/ Если вы хотите контролировать, какие строки / ячейки пишутся, вы можете сделать это с помощью pig-скриптов

x = LOAD 'hbase://<sourceDatabaseName>' USING org.apache.pig.backend.hadoop.hbase.HBaseStorage( '<family:qualifier>', '<family:qualifier2>','-loadKey true') AS (ID: bytearray  , Value1:chararray , Value2:chararray);

STORE x INTO '<destFileName>'
USING CSVExcelStorage(['<delimiter>' [,{'YES_MULTILINE' | 'NO_MULTILINE'} [,{'UNIX' | 'WINDOWS' | 'UNCHANGED'}]]]);
0 голосов
/ 14 января 2016

Если нам нужно больше контроля над Java-кодом, надеюсь, будет полезна ссылка ниже.

https://gist.github.com/sakthiinfotec/102fca54c91b411f626a

Это создаст резервную копию одной таблицы HBase в формате CSV в локальной файловой системе.Нам нужно предварительно определить список нужных нам столбцов из одного семейства столбцов.Этот код использует необходимые файлы jar для соединения таблицы HBase вместе с файлом jar OpenCSV для записи CSV-записей.

Предполагается, что все столбцы являются только строковыми.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...