Выполнение запросов Hive с помощью GCP Composer - PullRequest
0 голосов
/ 01 декабря 2018

Поэтому я планирую использовать GCP Composer для запуска нескольких заданий Hive.

Является ли использование Hive вместе с Dataproc лучшим способом сделать это?

Где должны храниться данные для этого?Может ли Dataproc считывать данные из корзины Google Cloud Storage?

Ответы [ 2 ]

0 голосов
/ 07 декабря 2018

Существует несколько способов отправить свои задания кустов в dataproc.
ДА dataproc считывает данные из корзины Google.Я уже ответил на этот вопрос ЗДЕСЬ

Существует несколько случаев, когда вы можете отправить свои задания улья в dataporc.
1) Вы можете напрямую дать команду, выбрав опцию запроса.
2) Вы можете выбрать опцию файла запроса и затем указать местоположение файла (хранилище Google).Примером этого является Здесь

Теперь перейдем к первому вопросу: Является ли использование hive вместе с Dataproc лучшим способом сделать это? -
Это полностью зависитпо вашему требованию.Есть много вариантов работы, вы должны выбрать в зависимости от ваших требований, и, следовательно, это становится лучшим.Я мог бы ответить на это более четко, если бы вы могли указать более подробную информацию о вашем требовании.

Что ж, я могу дать вам краткий обзор HIVE JOBS , чтобы вы могли удовлетворить ваши требования.

В заданиях Hive вы можете сделать следующее:

  • Вы можете задать встроенный запрос (один или несколько)
  • Вы можете задать форму запроса командыфайл запроса (один или несколько)
  • Вы можете добавить файлы JAR в свой куст - это может быть для любых целей, таких как UDF (один или несколько)
  • Вы можете добавить дополнительные свойства для настройкиРабота
  • Вы можете автоматизировать работу
    Это все о базовых улей работы.

Воздушный поток Документация Data Proc имеет все доступные операторы, которые вы можете использовать.

0 голосов
/ 01 декабря 2018

Да, Dataproc может считывать данные из GCS Bucket.Например, прочитайте это: https://cloud.google.com/solutions/using-apache-hive-on-cloud-dataproc#creating_a_hive_table

А затем вы можете использовать DataProcHiveOperator для выполнения запросов к нему с помощью Cloud Composer.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...