Я пытаюсь использовать Dataproc API, пытаясь преобразовать команду gcloud в API, но я не могу найти хороший пример в документации.
%pip install google-cloud-dataproc
Единственный хороший пример, который я нашел, этоэто работает нормально:
from google.cloud import dataproc_v1
client = dataproc_v1.ClusterControllerClient()
project_id = 'test-project'
region = 'global'
for element in client.list_clusters(project_id, region):
print('Dataproc cluster name:', element.cluster_name)
Мне нужно преобразовать в код Python следующую команду gcloud:
gcloud dataproc jobs submit hadoop --cluster "${CLUSTER_NAME}" \
--class com.mycompany.product.MyClass \
--jars "${JAR_FILE}" -- \
--job_venv=venv.zip \
--job_binary_path=venv/bin/python3.5 \
--job_executes program.py \