Мы получаем одну или две ошибки CheckPoint при обработке данных каждый день. Объем данных низкий, например, ниже 10 Кб, а наш интервал настройки составляет «2 минуты». (Причиной очень медленной обработки является то, что нам нужно передать данные в другую конечную точку API, которая занимает некоторое время для обработки в конце задания flink, поэтому время - Потоковая передача данных + прием на внешнюю конечную точку API).
Основная проблема:
Время ожидания контрольных точек истекает через 10 минут, это связано с тем, что время обработки данных превышает 10 минут, поэтому время ожидания контрольных точек истекло. Мы могли бы увеличить параллелизм, чтобы ускорить обработку, но если данные станут больше, нам придется снова увеличить параллелизм, поэтому мы не хотим использовать этот способ.
Предлагаемое решение:
Я видел, как кто-то предложил установить паузу между старой и новой контрольной точкой, но у меня есть вопрос: если я установлю там время паузы, будет ли на новой контрольной точке пропущено состояние во время паузы?
Aim:
Как избежать этой проблемы и записать правильное состояние, которое не пропускает никаких данных?
Сбой контрольной точки:
введите описание изображения здесь
Завершенный контрольный пункт:
введите описание изображения здесь
подзадача не отвечает
введите описание изображения здесь
Спасибо