Как правильно загружать данные в HBase из Apache Spark? - PullRequest
0 голосов
/ 16 декабря 2018

Я работаю над написанием задания Spark, которое считывает данные из Hive и сохраняет их в HBase для доступа в реальном времени.Исполнитель устанавливает связь с HBase, что является правильным подходом для вставки данных.Я подумал о следующих двух подходах.

Какой из них более уместен или есть какой-то другой подход?

  1. Запись данных напрямую из Spark Job в Hbase
  2. Запись данных из Spark в HDFS и последующее перемещениеэто к Hbase
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...