Проблема дублированной кодовой базы присуща лямбда-архитектуре.Об этом упоминается в разделе «Критика» на странице википедии
Другая проблема заключается в том, что данные между пакетом и потоком не синхронизированы, что может привести к неожиданным результатам при объединении данных,Например, объединение потоков и пакетов, когда ключи еще не существуют в пакетном режиме.
Я полагаю, что лямбда-архитектура основана на убеждении, что потоковая передача сложна и дорога, поэтому сохраняйте пакетную обработку как можно больше и добавляйте потоковую передачу только для тех элементов, которые требуют почти реального времени.У нас уже есть пакет, давайте добавим несколько потоковых вещей.
Альтернативная архитектура - использовать потоковую передачу для всего.Это основано на осознании того, что пакетная обработка - это особый случай потоковой передачи, так что выполняйте пакетную и потоковую обработку на одной потоковой платформе.
использование искровой структурированной потоковой передачи для пакетной обработки
проблемы с лямбда-архитектурой и способы их решения только при использовании потоковой передачи
опросархитектура лямбда