Как обрабатывать все партии один за другим плавно в потоковой передаче с искрой, чтобы избежать потери пакета данных.? - PullRequest
0 голосов
/ 26 ноября 2018

У меня есть задание потоковой передачи, которое выполняет следующие действия.

  1. 10 секунд - это время обработки триггера.
  2. Он выполнит операцию SQL и загрузит данные в ELK.

Итак, работа на спарке занимает больше времени, чем я упомянул (т. Е. 10 секунд при использовании триггера).что произойдет, если работа с искрой займет больше времени .?

  • Будет ли работа с искрой потерять пакет данных?Если да, то как этого избежать.ИЛИ
  • Is Spark будет автоматически обрабатывать пакеты .?

ПРИМЕЧАНИЕ. Я не должен терять какие-либо данные, если работа занимает больше времени, чем указано.Так что любые предложения .?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...