Согласно документу «Модель потока данных»: практический подход к балансу между корректностью, задержкой и стоимостью в крупномасштабной, неограниченной, неупорядоченной обработке данных:
MillWheel и Spark Streaming обадостаточно масштабируемый, отказоустойчивый и с малой задержкой, чтобы выступать в качестве разумных субстратов, но не хватает высокоуровневых программных моделей, которые упрощают расчет сеансов времени-события.
Всегда ли это так?