У нас есть структурированное потоковое задание, которое читает из kafka и выполняет сопоставление с состоянием с использованием API mapGroupWithState, а затем сохраняет полученный фрейм данных в
файловая система hdfs в формате паркета. Задание останавливается после запуска на некоторое время. Из журналов отладки похоже, что искровой контекст останавливается, что приводит к прекращению запроса.
18/05/14 06:34:54 ИНФОРМАЦИЯ SparkContext: вызов остановки () из отключающего крюка
После вышеприведенного сообщения об ошибке существует множество исключений, вызванных остановкой контекста искры.
Вот назначенные пределы памяти:
1 драйвер: 2 ГБ
2 исполнителя: по 2 ядра и 4 ГБ
Мы постоянно отслеживаем использование памяти JVM с помощью Graphite exporter. Использование памяти в любом процессе JVM приложения никогда не превышает 700 МБ.
Помимо приведенного выше сообщения об ошибке остальные исключения, по-видимому, срабатывают при остановке sc.
Может кто-нибудь предложить возможный сценарий, который может привести к такой ошибке?
P.S .: Задание даже завершалось, когда он просто писал консольному писателю вместо паркета.