Чтение данных по кластерам в Apache Spark - PullRequest
0 голосов
/ 23 февраля 2019

У меня есть огромная таблица, которую я загружаю из RedShift в csv-файл на S3, используя блокнот данных (DBx).Эта записная книжка работает на кластере A.
У меня есть другая записная книжка B, которая считывает данные из CSV-файлов в S3 в информационный кадр.Этот блокнот B работает на clusterB.
Теперь я хочу получить доступ к этому кадру данных в третьем блокноте C, который находится на clusterC.
Как мне это сделать?
registerTempTable зависит от сеанса.
createGlobalTempView может бытьдоступ к ноутбукам, но не к различным кластерам.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...