У меня есть кластер Databricks, работающий на некоторых виртуальных машинах. В моей организации есть кластер oop с кучей данных, которые мне нужны. У меня нет доступа к кластеру Had oop, только URL JDB C (все мои разрешения были разобраны, мне дали только URL).
Я могу открыть инструмент управления базой данных на моем локальном компьютере (Dbeaver) и успешно запрашивайте таблицы Hive.
Однако я пытаюсь запросить таблицы Hive, используя Databricks и PySpark. Похоже, что для установки строки подключения для HiveContext я обычно записывал бы ее в файл hive-site. xml. Однако Databricks не дает мне такой возможности.
Я на Улей 2.1.1 и Databricks 6.4 (включает в себя Apache Spark 2.4.5, Scala 2.11)
Теперь я не знаю, как просто подключиться к моей базе данных Hive.
# Spark context sc is implicit in Databricks
hive_context = spark.HiveContext(sc)
# I want to be able to do something like
df = hive_context.sql("SELECT...")