Можно ли перенести данные из одной базы данных HBASE в другую в другом кластере HDFS? - PullRequest
1 голос
/ 09 ноября 2019

У меня есть база данных HBASE (с N-таблицами) в двух кластерах (запад и восток). Оба с одинаковой схемой БД. Запад и Восток находятся в разных доменах.

Как перенести данные из каждой таблицы с определенной группой (например, сотрудники в «HR») с запада на восток?

Возможно (?) Решения:

  1. Для каждой таблицы на западе создайте снимок с запада, затем восстановите снимок с запада, а затем удалите все ненужные строки. (Я бы потерял все данные, которые были на Востоке)
  2. Для каждой таблицы на Западе создайте снимок и каким-то образом объедините снимок с Востоком. Затем удалите все ненужные строки. (Возможно ли объединить снимок с существующим HBASE?)
  3. Для каждой таблицы на западе создайте снимок, а затем клонируйте этот снимок на востоке как table_to_merge. Очистите таблицу 2, удалив ненужные строки, затем объедините table_snapshot с table_target.
  4. Для каждой строки в каждой таблице на западе запишите одну и ту же строку на восток. (Идеально, но мне нужно создать скрипт для подключения к обоим кластерам HDFS, что непросто, поскольку они находятся в двух разных доменах)
...