Как перечислить все базы данных, используя HiveContext в PySpark 1.6 - PullRequest
0 голосов
/ 24 июня 2019

Я пытаюсь перечислить все базы данных, используя HiveContext в Spark 1.6, но он предоставляет мне базу данных по умолчанию.

from pyspark import SparkContext
from pyspark.sql import SQLContext
sc = SparkContext.getOrCreate()
from pyspark.sql import HiveContext
sqlContext = HiveContext(sc)
sqlContext.sql("SHOW DATABASES").show()
+-------------+
|       result|
+-------------+
|      default|
+-------------+

1 Ответ

0 голосов
/ 24 июня 2019

Вызов SHOW DATABASES в sql - правильный подход в Spark <2.0. </p>

В Spark 2.0 или более поздней версии вы должны использовать pyspark.sql.catalog.Catalog.listDatabases:

spark.catalog.listDatabases()

Если вы не видите ожидаемые базы данных, это обычно означает одно из двух:

...