У меня есть требование чтения из таблицы источника улья из другого кластера - я пытаюсь исследовать, как этого можно достичь? Я планирую использовать соединение HiveServer2 (JDBC) в качестве опции. Может кто-нибудь, пожалуйста, напишите мне пример кода или ссылку URL.
Я пытался использовать "hive-jdbc.jar", и ниже кусок кода, он печатаетSchema, но при использовании с методом Show () - это не удается.
val jdbcDF = spark.read
.format("jdbc")
.option("url", "jdbc:hive2://34.223.237.55:10000")
.option("dbtable", "students1")
.option("user", "hduser")
.option("password", "hadoop")
.option("fetchsize", "20")
.load()
Примечание: улей имеет керберизацию
Любая помощь приветствуется.
Спасибо
Справочная задача: