Приложение Spark внезапно УБИВАЕТСЯ в EMR через 1 час, а сеанс livy заканчивается. Какова причина и решение? - PullRequest
0 голосов
/ 07 сентября 2018

Я использую JupyterHub в кластере AWS EMR. Я использую EMR версии 5.16

Я отправил приложение spark, используя ноутбук pyspark3. Мое приложение пытается записать данные 1 ТБ в s3. Я использую функцию автоматического масштабирования EMR для масштабирования нас на узле задачи.

Аппаратные конфигурации: 1. Главный узел: 32 ГБ ОЗУ с 16 ядрами Узел 2.Core: 32 ГБ оперативной памяти с 16 ядрами 3. Узел задачи: 16 ГБ с 8 ядрами в каждом. (Узлы задачи увеличиваются до 15)

Я заметил, что приложение Spark убивается после запуска в течение 50-60 минут. Я попробовал отладку: 1. В моем кластере все еще есть возможности для расширения. Так что это не проблема с нехваткой ресурсов. 2. Ливий сеанс также убит. 3. В журнале работ я увидел сообщение об ошибке RECVD TERM SIGNAL «Отключение крюка» получил "

Обратите внимание: 1. Я сохранил: spark.dynamicAllocation.enabled = true " 2. Я использую планировщик ярмарки пряжи с олицетворением пользователя в Jupiter hub

Не могли бы вы помочь мне разобраться в проблеме и решить ее?

1 Ответ

0 голосов
/ 16 мая 2019

Я думаю, что столкнулся с той же проблемой и нашел решение благодаря этому ответу .

Проблема связана с параметром конфигурации Livy livy.server.session.timeout, который по умолчанию устанавливает время ожидания для сеанса равным 1 часу.

Вы должны установить его, добавив следующую строку в конфигурации кластера EMR.

[{'classification': 'livy-conf','Properties': {'livy.server.session.timeout':'5h'}}]

Это решило проблему для меня.

...