Я создаю инфраструктуру, в которой я хотел бы обрабатывать горячие и холодные данные отдельно. Для горячих данных я записываю свои данные в Cloud Spanner, а для холодных данных я хотел бы записать свои данные во что-то более постоянное, например BigQuery.
Я использую данные из потоковой передачи service, но я бы хотел воспользоваться механизмом кэширования BigQuery, что будет невозможно, если я буду постоянно передавать холодные данные в BigQuery. Моя проблема заключается в том, могу ли я соединить потоковый конвейер с пакетным конвейером и подключить потоковый конвейер к Spanner, а пакетный конвейер - к BigQuery.
Я могу представить что-то вроде записи холодных данных в Облачное хранилище и считывание данных в BigQuery с помощью задания cron, но есть ли лучший / собственный способ добиться разделения Stream + Batch?