Как я могу запустить Pyspark в интерактивном режиме в Jupyter, используя режим YARN-client? - PullRequest
0 голосов
/ 28 апреля 2018

Теперь мне удалось запустить Pyspark в Jupyter в локальном режиме вторым способом, упомянутым в этом блоге . Вот код:

import findspark
findspark.init()
from pyspark import SparkContext
sc = SparkContext("local", "First App")

Я хочу запустить его в интерактивном режиме в режиме YARN-клиента, как я могу это сделать? Давайте пойдем дальше, как работать в разных режимах, например, в автономном режиме и в режиме YARN-кластера.

1 Ответ

0 голосов
/ 02 мая 2018

По Документам :

Основные URL-адреса принимают параметр yarn на основе переменной HADOOP_CONF_DIR или YARN_CONF_DIR

Так что я могу просто использовать: sc = SparkContext("yarn-client", "First App")

...