По замыслу это невозможно.Если вы глубоко погрузитесь в ядро Beam, вы программно определяете график выполнения, а затем запускаете его.Процесс является массово параллельным (ParDo
означает «Параллельное выполнение») на одном и том же узле или на нескольких узлах / виртуальных машинах.
Здесь количество шардов - это просто число «писателей», которые будут работать параллельно для записи файлов.Затем PCollection будет разделен на все рабочие записи.
Размер очень изменчив (например, размер сообщения, кодировка текста, сжатие или нет и коэффициент сжатия, ...), и Beam не может полагаться на него длястроит свой график.