Как подключиться к удаленной БД MapR с помощью PySpark? - PullRequest
0 голосов
/ 15 февраля 2019

У меня есть 2 сервера, на которых установлен и настроен MapR.Я использую Py-Spark для манипулирования данными.

Скажем так, серверы ниже активны.

Dev: dev_mapr_001 (IP = xx.xx.xx.xx)

Prod: prd_mapr_001 (IP = zz.zz.zz.zz)

Путь к таблице JSON: / my / json / table / path

Путь к таблице одинаков для обоих серверов.

Я использую PySpark для подключения к серверам Dev и Prd.

prod_table_path = /my/json/table/path
spark = SparkSession.builder.master('spark://zz.zz.zz.zz:7077').appName("Test_Job").getOrCreate()
df = spark.loadFromMapRDB(prod_table_path)

Я запускаю приведенный выше скрипт из DEV для подключения к PROD.И он не может подключиться.

Как я могу это сделать?

...