О Ливийской сессии для Jupyterhub на AWS EMR Spark - PullRequest
0 голосов
/ 24 декабря 2018

У моего клиента есть коннектор AD, настроенный на Jupyterhub, установленный на AWS EMR, чтобы разные пользователи проходили аутентификацию на jupyterhub через AD.В настоящее время понимается, что когда разные пользователи отправляют свои искровые задания через записную книжку Jupyter на Jupyterhub в общий базовый искровой механизм EMR, искровое задание будет отправляться через Livy на искровой двигатель.Каждому сеансу Livy будет сопоставлен соответствующий сеанс искры (это мое текущее понимание и исправьте меня, если я ошибаюсь)

Вопрос в том, будет ли другой пользователь Jupyterhub использовать тот же Livyсеанс (затем другой сеанс зажигания) или другой сеанс Livy (затем другой сеанс зажигания)?

Единственный ограниченный материал, который я могу найти:

https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-jupyterhub.html

см. Эту фотографию арки здесь

Заранее большое спасибо!

1 Ответ

0 голосов
/ 26 декабря 2018

Насколько я знаю (проверено на дистрибутиве HDP), по умолчанию сервер Livy создаст другой драйвер Spark и, следовательно, разные сессии для каждого пользователя.Сервер доступен через Kerberized HTTP-интерфейс, поэтому пользователь должен прийти с действительным билетом, и соответствующий сеанс будет запущен под его именем.Похоже, это путь, так как в этом случае пользователь будет иметь доступ к своим собственным ресурсам (данные, очередь YARN и т. Д.).В этом случае сервер livy олицетворяет пользователя , он запускает задание Spark, как если бы он был пользователем (см. Предоставление Livy возможности олицетворения .

Byпроверка в doc Я видел, что вы можете точно таким же образом настроить сервер Livy в EMR.

По умолчанию задания YARN, отправленные таким образом, запускаются как пользователь livyнезависимо от пользователя, инициировавшего задание. Установив олицетворение пользователя, пользовательский идентификатор пользователя ноутбука также может быть связан с заданием YARN. Вместо того, чтобы задания, инициированные как Ширли, так и Диего, были связаны сlivy пользователя, задания, которые каждый пользователь инициирует, связаны с shirley и diego соответственно . Это помогает вам контролировать использование Jupyter и управлять приложениями в вашей организации.

Таким образом, у вас есть выбор - использоватьолицетворение (запуск от имени отдельных пользователей) или нет (запуск от имени livy пользователя).

...