Сначала мы создаем классификацию конфигурации с именем emr. json, в которой AWS Каталог данных клея указывается как метастор для Hive:
[
{
"Classification": "hive-site",
"Properties": {
"hive.metastore.client.factory.class": "com.amazonaws.glue.catalog.metastore.AWSGlueDataCatalogHiveClientFactory",
"hive.metastore.schema.verification": "false"
}
}
]
Примечание. В версии выпуска EMR 5.28.0, 5.28.1 или 5.29.0, если вы создаете кластер с использованием каталога данных клея AWS в качестве метастаза, мы устанавливаем hive.metastore.schema.verification в значение false.
Наконец, мы объединяем файл классификации конфигурации с нашей последней командой следующим образом:
aws emr create-cluster --name "syumaK-cluster" --configurations file://emr.json --release-label emr-5.28.0 --use-default-roles --applications Name=Hadoop Name=Spark Name=Hive Name=HUE --instance-groups InstanceGroupType=MASTER,InstanceCount=1,InstanceType=m1.medium InstanceGroupType=CORE,InstanceCount=2,InstanceType=m1.medium
Ответ:
{
"ClusterId": "j-2NZ6xxxxxx",
"ClusterArn": "arn:aws:elasticmapreduce:us-east-1:1925xxxxx:cluster/j-2NZ6xxxxxx"
}
Надеюсь, это поможет!