Я хочу использовать GlueMetaStore с spark.sql.
Для этого я настроил кластер EMR (5.16) и установил следующие конфигурации:
{
"Classification":"hive-site",
"ConfigurationProperties":
{
"hive.metastore.client.factory.class":"com.amazonaws.glue.catalog.metastore.AWSGlueDataCatalogHiveClientFactory"
},
"Configurations":[]
},
{
"Classification":"spark-hive-site",
"ConfigurationProperties":
{
"hive.metastore.client.factory.class":"com.amazonaws.glue.catalog.metastore.AWSGlueDataCatalogHiveClientFactory"
},
"Configurations":[]
}
Я использовал spark-core для запросов к базам данных в JupyterHub, но я просто получаю базу данных по умолчанию, которая пуста. Там должно быть много больше базы данных, когда она работает.
Нужно ли использовать enbaleHiveSupport или что-то симулирующее, чтобы соединение работало, если да, как я могу установить его в JupterHub, потому что контекст уже загружен?