Можем ли мы создать метаданные для spark так же, как hive.
Spark сделает это за вас, и вам не нужно использовать отдельную установку Hive или даже ее часть(например, метасторское хранилище Hive).
Независимо от того, какую установку Apache Spark вы используете, Spark SQL использует внутреннее метасторье Hive для той же цели, что и Hive (но теперь метасторное хранилище является частью Spark SQL).
если да, какую реляционную БД мы можем использовать для хранения метаданных?
Все, что поддерживает Hive, например Oracle, MySQL, PostgreSQL.Конфигурация почти такая же, как и в случае отдельной установки Hive (что обычно имеет место в таких корпоративных установках).
Возможно, вы захотите прочитать Hive Metastore .