Опрос хранилища облачных данных из облачного потока данных (Apache Beam), лучшие практики - PullRequest
0 голосов
/ 26 января 2019

Установка:

  • потоковое задание на передачу данных в облаке
  • события приходят через pubsub
  • состояние хранится в хранилище данных, где нам нужно обновлять состояние для каждого входящего события

Вопрос:

Как добиться максимальной производительности, чтобы получить / обновить / поместить экземпляр из / в облачное хранилище данных из ParDo в потоковом облачном потоке данных?

  • можно / нужно выполнять асинхронные вызовы в Apache Beam? (как во Флинке)
  • это хорошая идея для пакетных звонков, используя startBundle?
  • боковые входы невозможны, так как я не могу получить их по ключу, правильно?
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...