Задание структурированной потоковой передачи резко останавливается - PullRequest
0 голосов
/ 14 мая 2018

У нас есть структурированное потоковое задание, которое читает из kafka и выполняет сопоставление с состоянием с использованием API mapGroupWithState, а затем сохраняет полученный фрейм данных в файловая система hdfs в формате паркета. Задание останавливается после запуска на некоторое время. Из журналов отладки похоже, что искровой контекст останавливается, что приводит к прекращению запроса.

18/05/14 06:34:54 ИНФОРМАЦИЯ SparkContext: вызов остановки () из отключающего крюка

После вышеприведенного сообщения об ошибке существует множество исключений, вызванных остановкой контекста искры.

Вот назначенные пределы памяти: 1 драйвер: 2 ГБ 2 исполнителя: по 2 ядра и 4 ГБ

Мы постоянно отслеживаем использование памяти JVM с помощью Graphite exporter. Использование памяти в любом процессе JVM приложения никогда не превышает 700 МБ.

Помимо приведенного выше сообщения об ошибке остальные исключения, по-видимому, срабатывают при остановке sc.

Может кто-нибудь предложить возможный сценарий, который может привести к такой ошибке?

P.S .: Задание даже завершалось, когда он просто писал консольному писателю вместо паркета.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...