Контрольные точки хороши, когда вам не нужно менять код, процедуры запуска и забывания являются идеальными вариантами использования.
Я прочитал сообщение из опубликованных вами блоков данных, правда в том, что вы не можете знать,какие изменения призваны делать, пока вы не должны их делать.Интересно, как они могут предсказать будущее.
Насчет ссылки на Cloudera, да, они говорят о старой процедуре, но с помощью структурированной потоковой передачи все равно изменения кода лишают вас контрольных точек.
Итак, вПо моему мнению, такая большая автоматизация хороша для процедуры Fire and Forget.Если это не ваш случай, сохранение смещения Кафки в другом месте - это хороший способ перезапустить с того места, где вы ушли в прошлый раз;вы знаете, что Kafka может содержать много данных и перезапускаться с нуля, чтобы избежать потери данных или принять идею перезапуска с последнего смещения, иногда это не всегда приемлемо.
Помните: любое изменение логики потока будет игнорироваться какПока есть контрольные точки, поэтому вы не можете вносить изменения в свою работу после развертывания, если вы не согласны с идеей отбросить контрольные точки.Отбрасывая контрольные точки, вы должны заставить задание повторно обработать всю тему Kafka (самое раннее) или начать прямо в конце (самое последнее), пропуская необработанные данные.
Это здорово, не правда ли?