Я пытаюсь создать кластер HDInsight Spark. У меня также есть хранилище Datalake, которое я хочу использовать в кластере HDInsight. Я сгенерировал сертификат для подключения HDInsight к Datalake. Я сделал это на веб-портале и скачал шаблоны и сертификат. Теперь я использую интерфейс командной строки Azure для создания кластера и его автоматического удаления при необходимости.
deploy.sh (я только что добавил подробные и параметры отладки к последней команде)
set -euo pipefail
# -e: immediately exit if any command has a non-zero exit status
# -o: prevents errors in a pipeline from being masked
# IFS new value is less likely to cause confusing bugs when looping arrays or arguments (e.g. $@)
usage() { echo "Usage: $0 -i <subscriptionId> -g <resourceGroupName> -n <deploymentName> -l <resourceGroupLocation>" 1>&2; exit 1; }
declare subscriptionId=""
declare resourceGroupName=""
declare deploymentName=""
declare resourceGroupLocation=""
# Initialize parameters specified from command line
while getopts ":i:g:n:l:" arg; do
case "${arg}" in
shift $((OPTIND-1))
#Prompt for parameters is some required parameters are missing
if [[ -z "$subscriptionId" ]]; then
echo "Your subscription ID can be looked up with the CLI using: az account show --out json "
echo "Enter your subscription ID:"
read subscriptionId
[[ "${subscriptionId:?}" ]]
if [[ -z "$resourceGroupName" ]]; then
echo "This script will look for an existing resource group, otherwise a new one will be created "
echo "You can create new resource groups with the CLI using: az group create "
echo "Enter a resource group name"
read resourceGroupName
[[ "${resourceGroupName:?}" ]]
if [[ -z "$deploymentName" ]]; then
echo "Enter a name for this deployment:"
read deploymentName
if [[ -z "$resourceGroupLocation" ]]; then
echo "If creating a *new* resource group, you need to set a location "
echo "You can lookup locations with the CLI using: az account list-locations "
echo "Enter resource group location:"
read resourceGroupLocation
#templateFile Path - template file to be used
if [ ! -f "$templateFilePath" ]; then
echo "$templateFilePath not found"
exit 1
#parameter file path
if [ ! -f "$parametersFilePath" ]; then
echo "$parametersFilePath not found"
exit 1
if [ -z "$subscriptionId" ] || [ -z "$resourceGroupName" ] || [ -z "$deploymentName" ]; then
echo "Either one of subscriptionId, resourceGroupName, deploymentName is empty"
#login to azure using your credentials
az account show 1> /dev/null
if [ $? != 0 ];
az login
#set the default subscription id
az account set --subscription $subscriptionId
set +e
#Check for existing RG
az group show --name $resourceGroupName 1> /dev/null
if [ $? != 0 ]; then
echo "Resource group with name" $resourceGroupName "could not be found. Creating new resource group.."
set -e
set -x
az group create --name $resourceGroupName --location $resourceGroupLocation 1> /dev/null
echo "Using existing resource group..."
#Start deployment
echo "Starting deployment..."
set -x
az group deployment create --name "$deploymentName" --resource-group "$resourceGroupName" --template-file "$templateFilePath" --parameters "@${parametersFilePath}" --verbose --debug
if [ $? == 0 ];
echo "Template has been successfully deployed"
"$schema": "http://schema.management.azure.com/schemas/2014-04-01-preview/deploymentTemplate.json#",
"contentVersion": "",
"parameters": {
"clusterName": {
"type": "string",
"metadata": {
"description": "The name of the HDInsight cluster to create."
"clusterLoginUserName": {
"type": "string",
"defaultValue": "admin",
"metadata": {
"description": "These credentials can be used to submit jobs to the cluster and to log into cluster dashboards."
"clusterLoginPassword": {
"type": "securestring",
"metadata": {
"description": "The password must be at least 10 characters in length and must contain at least one digit, one non-alphanumeric character, and one upper or lower case letter."
"location": {
"type": "string",
"defaultValue": "westeurope",
"metadata": {
"description": "The location where all azure resources will be deployed."
"clusterVersion": {
"type": "string",
"defaultValue": "3.6",
"metadata": {
"description": "HDInsight cluster version."
"clusterWorkerNodeCount": {
"type": "int",
"defaultValue": 4,
"metadata": {
"description": "The number of nodes in the HDInsight cluster."
"clusterKind": {
"type": "string",
"defaultValue": "SPARK",
"metadata": {
"description": "The type of the HDInsight cluster to create."
"sshUserName": {
"type": "string",
"defaultValue": "sshuser",
"metadata": {
"description": "These credentials can be used to remotely access the cluster."
"sshPassword": {
"type": "securestring",
"metadata": {
"description": "The password must be at least 10 characters in length and must contain at least one digit, one non-alphanumeric character, and one upper or lower case letter."
"identityCertificate": {
"type": "securestring"
"identityCertificatePassword": {
"type": "securestring"
"resources": [
"apiVersion": "2015-03-01-preview",
"name": "[parameters('clusterName')]",
"type": "Microsoft.HDInsight/clusters",
"location": "[parameters('location')]",
"dependsOn": [],
"properties": {
"clusterVersion": "[parameters('clusterVersion')]",
"osType": "Linux",
"tier": "standard",
"clusterDefinition": {
"kind": "[parameters('clusterKind')]",
"componentVersion": {
"Spark": "2.3"
"configurations": {
"gateway": {
"restAuthCredential.isEnabled": true,
"restAuthCredential.username": "[parameters('clusterLoginUserName')]",
"restAuthCredential.password": "[parameters('clusterLoginPassword')]"
"core-site": {
"fs.defaultFS": "adl://home",
"dfs.adls.home.hostname": "vivienda.azuredatalakestore.net",
"dfs.adls.home.mountpoint": "/clusters/vivienda/"
"clusterIdentity": {
"clusterIdentity.applicationId": "5e6237dc-897d-4a94-9913-e25a987d00bc",
"clusterIdentity.certificate": "[parameters('identityCertificate')]",
"clusterIdentity.aadTenantId": "https://login.windows.net/c1c86fed-0aa0-465e-92be-5b97e2b584f9",
"clusterIdentity.resourceUri": "https://datalake.azure.net/",
"clusterIdentity.certificatePassword": "[parameters('identityCertificatePassword')]"
"storageProfile": {
"storageaccounts": []
"computeProfile": {
"roles": [
"autoScale": null,
"name": "headnode",
"minInstanceCount": 1,
"targetInstanceCount": 2,
"hardwareProfile": {
"vmSize": "Standard_D12_V2"
"osProfile": {
"linuxOperatingSystemProfile": {
"username": "[parameters('sshUserName')]",
"password": "[parameters('sshPassword')]"
"virtualNetworkProfile": null,
"scriptActions": []
"autoScale": null,
"name": "workernode",
"targetInstanceCount": 4,
"hardwareProfile": {
"vmSize": "Standard_D13_V2"
"osProfile": {
"linuxOperatingSystemProfile": {
"username": "[parameters('sshUserName')]",
"password": "[parameters('sshPassword')]"
"virtualNetworkProfile": null,
"scriptActions": []
parameters.json (думаю, мои проблемы связаны с этим файлом)
"$schema": "https://schema.management.azure.com/schemas/2015-01-01/deploymentParameters.json#",
"contentVersion": "",
"parameters": {
"clusterName": {
"value": "cname"
"clusterLoginUserName": {
"value": "admin"
"clusterLoginPassword": {
"value": null
"location": {
"value": "westeurope"
"clusterWorkerNodeCount": {
"value": 4
"clusterKind": {
"value": "SPARK"
"clusterVersion": {
"value": "3.6"
"sshUserName": {
"value": "sshuser"
"sshPassword": {
"value": null
"identityCertificate": {
"value": null
"identityCertificatePassword": {
"value": null
В параметре.json необходимо заполнить " clusterLoginPassword ", " sshPassword ", " identityCertificate " и " identityCertificatePassword ». Я пытался заполнить эти поля по-разному, но я получаю ошибки со всеми из них.
1) 3 поля пароля со строковым значением «XXXXX» и identityCertificate с путем к файлу сертификата «cert-download.pfx».
"код": "BadRequest",
"message": "Ошибка проверки ввода пользователя. Ошибки: полезная нагрузка запроса недопустима. Входные данные не являются допустимой строкой Base-64, так как содержат неосновной 64-символ, более двух символов заполнения или недопустимый символ среди символы заполнения. "
2) Конвертировать пароли в базу 64
"код": "BadRequest",
"message": "Ошибка проверки ввода пользователя. Ошибки: полезная нагрузка запроса недопустима. Входные данные не являются допустимой строкой Base-64, так как содержат неосновной 64-символ, более двух символов заполнения или недопустимый символ среди символы заполнения. "
3) Как я увидел в файле шаблона, что все эти файлы имеют тип securestring , используя следующий код powershell, я получил содержимое сертификата в base64:
PS /tmp/azure> $certPassword = "XXXXXXXX"
PS /tmp/azure> $certFilePath = "cert-download.pfx"
PS /tmp/azure> $certPasswordSecureString = ConvertTo-SecureString $certPassword -AsPlainText -Force
PS /tmp/azure> $certificatePFX = New-Object System.Security.Cryptography.X509Certificates.X509Certificate2($certFilePath, $certPasswordSecureString)
PS /tmp/azure> $credential = [System.Convert]::ToBase64String($certificatePFX.GetRawCertData())
PS /tmp/azure> $credential
Я поместил этот результат в файл параметров.
«код»: «BadRequest»,
«message»: «DeploymentDocument« AmbariConfiguration_1_7 »не прошел проверку. Ошибка:« Детали принципала службы недействительны - закрытый ключ отсутствует в сертификате X.509. », DeploymentDocument« AmbariConfiguration_1_7 »не прошел проверку. Ошибка:« Ошибка при получение доступа к учетной записи хранилища данных vivienda: закрытый ключ отсутствует в сертификате X.509 .. '"
Я также читал о хранилище ключей , но я не видел, как его использовать из файла parameters.json.
Так что мне нужна помощь в правильном заполнении параметров.json:)
Заранее спасибо