Где хранятся метаданные каталога Spark? - PullRequest
0 голосов
/ 11 октября 2018

Пытался получить точное представление о том, как API-интерфейс каталога Spark хранит метаданные.

Я нашел некоторые ресурсы, но ответа не получил:

Я вижу некоторые учебники, которые считают само собой разумеющимся существование Hive Metastore.

  • Is HiveВозможно, Metastore включен в дистрибутив Spark?
  • Кластер Spark может быть недолговечным, но метасторье Hive, очевидно, потребуется долгоживущий

Помимо функции каталога, разбиения и сортировкифункции при написании DF, похоже, зависят от Hive ... Таким образом, «все» воспринимают Hive как должное, когда говорят о ключевых особенностях Spark для сохранения DF.

1 Ответ

0 голосов
/ 12 октября 2018

Spark узнает о Hive MetaStore, когда ему предоставляется hive-site.xml, который обычно находится под $SPARK_HOME/conf.Всякий раз, когда при создании SparkSession используется метод enableHiveSupport(), Spark находит, где и как подключиться к метастаферу Hive.Поэтому Spark явно не сохраняет настройки улья.

...