Я хотел бы использовать данные из pubsub с помощью задания потоковой передачи данных и сохранять их в GCS в почасовых каталогах.
Какой подход лучше?
Я попытался использовать WindowedFilenamePolicy, но он добавляет дополнительную группу и замедляет операцию записи во время записи. Поток данных правильно буферизует данные, но запись данных во временную корзину занимает слишком много времени.
Есть ли лучшие практики для такого довольно распространенного случая?
С уважением,
Pari