Syn c Таблицы Hive в разных кластерах - PullRequest
0 голосов
/ 05 августа 2020

У меня есть 2 разных хранилища метаданных Hive (для сред dev и qa) поверх Google Storage.

В QA ежедневно обновляется таблица (пакетное задание), и мне нужно синхронизировать данные с DEV .

Какие параметры у меня есть?

  1. Spark не поддерживает несколько экземпляров Hive (возможно ли перенастроить SparkContext так, чтобы он указывал на другой экземпляр Hive во время выполнения?)
  2. не уверен, что у меня есть доступ к импорт / экспорт
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...