Установка:
- потоковое задание на передачу данных в облаке
- события приходят через pubsub
- состояние хранится в хранилище данных, где нам нужно обновлять состояние для каждого входящего события
Вопрос:
Как добиться максимальной производительности, чтобы получить / обновить / поместить экземпляр из / в облачное хранилище данных из ParDo в потоковом облачном потоке данных?
- можно / нужно выполнять асинхронные вызовы в Apache Beam? (как во Флинке)
- это хорошая идея для пакетных звонков, используя
startBundle
?
- боковые входы невозможны, так как я не могу получить их по ключу, правильно?