Данные, доступные в одном из кластеров Hive (Say Cluster A) в виде таблиц Hive (на самом деле таблицы HBase, созданные таблицы Hive поверх таблиц HBase), мне нужно скопировать данные в этих таблицах в другой кластер (Say Cluster B)либо в виде таблиц HBase, либо в таблицах Hive.
Существующие записи в таблицах Hive в кластере A также обновляются. В этом случае Как можно постепенно загружать данные из кластера A в кластер B.
Я знал rowkeyв таблицах HBase, давайте возьмем это как Id.Я использую экосистему данных MapR Big.
Может ли кто-нибудь помочь мне в разработке решения здесь?
Заранее спасибо.