Есть ли что-то вроде хранимой процедуры / задания в Hadoop (Hive) - PullRequest
0 голосов
/ 26 октября 2018

Я использую Cloudera 5.14 Hadoop с PySpark на Hive. И мне было интересно, есть ли возможность иметь что-то вроде хранимой процедуры в Hadoop?

Чего я пытаюсь достичь? Есть ли способ, как настроить работу, которая будет работать, например, каждый день утром заходите в какой-нибудь стол Hive и пишите что-нибудь там + отправляйте электронное письмо.

Что для этого необходимо - заметьте, у меня нет прав администратора для кластера, однако я могу запускать сценарии оболочки через модуль Python подпроцесса . Также возможно ли как-то отправить письмо из скрипта PySpark?

1 Ответ

0 голосов
/ 26 октября 2018

Hadoop не может самостоятельно планировать работу.Вы можете планировать задания, используя Apache Oozie Workflow Scheduler для Hadoop

Другой способ использовать простые cron задания для выполнения файла сценария

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...