Как отправить собственное искровое приложение в Azure Databricks? - PullRequest
0 голосов
/ 23 мая 2019

Я создал небольшое приложение, которое через определенные промежутки времени отправляет искровое задание и создает несколько аналитических отчетов.Эти задания могут считывать данные из локальной файловой системы или распределенной файловой системы (fs может быть HDFS, ADLS или WASB).Могу ли я запустить это приложение в кластере баз данных Azure?

Приложение отлично работает в кластере HDInsights, так как я смог получить доступ к узлам.Я сохранил развертываемый jar-файл в одном месте, запустил его, используя скрипт запуска, аналогично, я также мог остановить его, используя подготовленный мной скрипт остановки.

Одна вещь, которую я обнаружил, состоит в том, что у Azure Databricks есть собственная файловая система.: ADFS, я также могу добавить поддержку для этой файловой системы, но тогда я смогу развернуть и запустить свое приложение, как я смог сделать это в кластере HDInsight?Если нет, есть ли способ отправить задания из пограничного узла, моего кластера HDInsight или любого другого кластера OnPrem в кластер баз данных Azure.

1 Ответ

0 голосов
/ 24 мая 2019

Вы смотрели на Джобса? https://docs.databricks.com/user-guide/jobs.html. Вы можете отправлять баночки для спарк-отправки точно так же, как в HDInsight.

Файловая система Databricks - DBFS - для озера данных Azure используется ABFS. Вам не нужно изменять приложение для них - пути к файлам будут обрабатываться блоками данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...