Question

Для запуска искровых заданий Scala и для выполнения запросов искровых оболочек ... Я был SSHing в Masternode EMR, и теперь команда, которая отвечает за управление облаком, не позволяет мне SSH в EMN mastertern.Какие альтернативные модели могут быть использованы?

dijksterhuis · Answer 1 · 07 сентября 2018

Zeppelin - ваш лучший выбор, если облачная команда с радостью предоставит доступ к нему.

Интерпретатор %spark в значительной степени spark-shell работает в абзаце ноутбука.

Он также импортирует важные вещи, такие как spark.sql, SparkContext и т. Д. По умолчанию, поэтому вам не нужно ничего импортировать и вы можете просто запустить код, например:

%spark
val myDf = spark.sql(“select * from table”)
myDf.limit(10).show()

val myOtherDf = spark.read.csv(“s3://bucket/key/object.csv”)
myOtherDf.limit(10).show()

(spark-shell может сделать это тоже, но я не использую это достаточно, чтобы узнать от руки)

Поскольку Zeppelin фактически работает на главном узле Spark, вы даже можете получить доступ к операционной системе главного узла с помощью интерпретатора оболочки %sh например ::

%sh
ls /
aws s3 cp s3://mybucket/myfile /

Хотя ваш доступ, конечно, зависит от разрешений ОС.

Имейте в виду, что как только вы убьете кластер, ваш ноутбук тоже исчезнет! Не забудьте скачать его, когда это возможно.

EMR Master SSH запрещен

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

EMR Master SSH запрещен

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы