Заранее спасибо.
Я пытался импортировать данные из DB2 в таблицу HBase, используя SQOOP, который занимает очень очень много времени, чтобы даже инициировать карту и уменьшить ее.Я могу видеть только карту 0 и уменьшить 0 все время.
Я могу поставить ту же команду в DB2, и результаты будут быстрее, чем я ожидал.Но когда я импортирую то же самое в HBASE.Принимать очень долго (10 часов).Создал образец данных в DB2 (150 записей) и попытался импортировать его в HBASE, по-прежнему занимая столько же времени.
sqoop import --connect jdbc:db2://{hostname}:50001/databasename --username user --password pass --hbase-create-table --hbase-table new_tbl --column-family abc --hbase-row-key=same --query "select a,b,c,d,e concat(a,e) from table_name where \$CONDITIONS AND a>='2018-08-01 00:00:01' and b<='2018-08-01 00:00:02'" -m 1
Попробовал отрегулировать все конфигурации
yarn.nodemanager.resource.memory-mb=116800
yarn.scheduler.minimum-allocation-mb=4096
mapreduce.map.memory.mb=4096
mapreduce.reduce.memory.mb=8192
mapreduce.map.java.opts=-Xmx3072m
mapreduce.reduce.java.opts=-Xmx6144m
yarn.nodemanager.vmem-pmem-ratio=2.1
В Sqoop Side я попытался настроить запрос, а также небольшие конфигурации. -M 4 создать некоторую несогласованность в записях.фильтр (временные метки (a, b)), все еще занимающий длительное время (10 часов)
Результаты теста производительности HBASE довольно хорошие.
HBase Performance Evaluation
Elapsed time in milliseconds=705914
Row count=1048550
File Input Format Counters
Bytes Read=778810
File Output Format Counters
Bytes Written=618
real 1m29.968s
user 0m10.523s
sys 0m1.140s