Вы можете получить доступ к оптимизированному графику и объединенным этапам, либо позвонив по номеру project.locations.jobs.get , либо через gcloud, выполнив следующую команду:
gcloud dataflow jobs describe --full $JOB_ID --format json
Исходя из ответа, слитые ступени будут описаны в объекте ExecutionStageSummary в массиве ComponentTransform . Ниже приведен пример вывода шаблона Cloud Pub / Sub для BigQuery предоставленного Google шаблона. В этом случае мы можем видеть, что график был объединен в 3 шага, в значительной степени очерченных шагом Reshuffle
в приемнике BigQueryIO :
- S03 - Все преобразования до
Reshuffle
в WriteSuccessfulRecords
и WriteFailedRecords
- S02 - Все преобразования после
Reshuffle
в WriteSuccessfulRecords
- S01 - Все преобразования после
Reshuffle
in WriteFailedRecords
Полный вывод
Поскольку описание задания довольно многословно, вы можете подумать о том, чтобы передать вывод в jq
, чтобы легко извлечь соответствующие биты в однострочной команде, например ниже:
gcloud dataflow jobs describe --full $JOB_ID --format json | jq '.pipelineDescription.executionPipelineStage[] | {"stage_id": .id, "stage_name": .name, "fused_steps": .componentTransform }'