HDP и Dataproc - это разные продукты.Я имею в виду, что вам не нужно создавать кластер Dataproc для выполнения bdutil.Достаточно выполнить его из одного экземпляра, потому что вся необходимая конфигурация установлена в bdutil_env.sh/ambari.conf.Инструмент bdutil не создает кластер Dataproc, вместо этого создаются пользовательские экземпляры vm для размещения HDP.
Вот некоторые шаги, которые не очень хорошо документированы:
Я установил переменную GOOGLE_APPLICATION_CREDENTIALS , и проблема с разрешением исчезла.Скорее всего, это проблема, с которой вы сталкиваетесь.1.1, если это не работает, выполните эту команду: gcloud auth activate-service-account --key-file=/PATH/JSON_CREDENTIALS
Если другие ошибки появляются как «Недопустимая зона значений (unset)», просто установите их в bdutil_env.sh
2.1 Если остаются те же самые ошибки, перейдите непосредственно к platform / hdp / ambari.conf для обновления вашей конфигурации.
Вам потребуется настроить разрешающие правила брандмауэра для доступа к вашим экземплярам, чтобы разрешитьсвязь между узлами и доступ к Ambari в мастере.
После выполнения описанных выше шагов я мог бы использовать Ambari для установки HDP.