DataprocClusterCreateOperator воздушного потока - PullRequest
0 голосов
/ 30 августа 2018

В настройках Airflow DataprocClusterCreateOperator:

У нас есть возможность установить тип основного диска для основного и рабочего диска на pd-ssd?

По умолчанию установлено значение standard.

Я изучал документацию - я не нашел никаких параметров.

Ответы [ 2 ]

0 голосов
/ 30 августа 2018

К сожалению, нет возможности изменить тип диска в DataprocClusterCreateOperator.

В Google API это доступно, если вы передадите параметр в https://cloud.google.com/dataproc/docs/reference/rest/v1/projects.regions.clusters#diskconfig

Я попытаюсь добавить эту функцию и должен быть доступен в Воздушный поток 1.10.1 или Воздушный поток 2.0 .

На данный момент вы можете создать плагин Airflow, который изменяет текущий DataprocClusterCreateOperator.

0 голосов
/ 30 августа 2018

Похоже, есть два поля в отношении этого:

master_machine_type: Compute engine machine type to use for the master node
worker_machine_type: Compute engine machine type to use for the worker nodes

Я обнаружил, что это просто просмотр исходного кода здесь (это для последней версии, но не было предоставлено никакой версии, поэтому я предположил последнюю версию):

https://airflow.readthedocs.io/en/latest/_modules/airflow/contrib/operators/dataproc_operator.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...