Как получить блок данных (DBU) Azure Databricks Workspaces? - PullRequest
0 голосов
/ 07 октября 2019

Есть ли способ получить единицы данных (DBU) для существующего рабочего пространства Azure для блоков данных?

1 Ответ

0 голосов
/ 07 октября 2019

Есть ли способ получить единицы (DBU) блоков данных для существующей рабочей области Azure?

Да, вы можете получить единицы (DBU) блоков данных для существующих блоков данных Azure. Рабочее пространство путем создания кластера в рабочем пространстве.

Что такое DBU?

Использование блоков данных Azure измеряется единицами блоков данных (DBU), единицами производительности обработки Apache Spark начас в зависимости от типа экземпляра виртуальной машины.

Единица данных («DBU») - это единица обработки в час, оплачиваемая в секунду.

Примечание: Вам необходимо создать кластерзаставить экземпляр виртуальной машины Azure Databricks (стоимость виртуальной машины + стоимость DBU) выполнять любые рабочие нагрузки.

enter image description here

Кластер Azure Databricks представляет собой набор вычислительных ресурсов иконфигурации, в которых выполняются рабочие нагрузки по проектированию данных, науке о данных и анализу данных, такие как производственные ETL-конвейеры, потоковая аналитика, специальная аналитика и машинное обучение.

Эти рабочие нагрузки выполняются в виде набора команд втетрадь или как автоматизированная работа. Azure Databricks различает интерактивные кластеры и автоматизированные кластеры. Вы используете интерактивные кластеры для совместного анализа данных с помощью интерактивных записных книжек. Вы используете автоматизированные кластеры для выполнения быстрых и надежных автоматизированных заданий.

Вы можете создать интерактивный кластер с помощью интерфейса пользователя, интерфейса командной строки или REST API. Вы можете вручную завершить и перезапустить интерактивный кластер. Несколько пользователей могут совместно использовать такие кластеры для совместного интерактивного анализа.

Планировщик заданий Azure Databricks создает автоматический кластер при запуске задания в новом автоматизированном кластере и завершает работу кластера после его завершения. Невозможно перезапустить кластер заданий.

Ссылка: Блоки данных Azure - кластеры и " Быстрый запуск: запуск задания Spark для блоков данных Azure с помощью портала Azure ".

Надеюсь, это поможет.

...