В нашем приложении мы читаем данные из PubSub, используя PubsubIO, в конвейере потока данных. Ниже приведен код.
PCollection<String> pubsubMsg = pipeline
.apply(PubsubIO.readStrings().fromSubscription(options.getInputSubscription1()))
PCollection<String> groupByBigqueryResult = pubsubMsg.apply("Read from bigquery table",
ParDo.of(new ReadRawdataFromBiqueryTable()));
Но когда мы присоединяем чтение BigQuery к этому конвейеру, так как чтение BigQuery идет медленно, так как мы делаем это в ParDo, кажется, что в SubScriber PubSub реализованы некоторые настройки управления потоком по умолчанию следовательно, я вижу, что скорость потока сообщений PubSub очень низкая, но если я закомментирую реализацию чтения BigQuery, выполненную в ReadRawdataFromBiqueryTable, то она будет быстрой. Как переопределить настройки управления потоком. Приложены оба задания потока данных 1. с большим запросом чтения
2. закомментировал bigquery читать часть ![Big Query Read Commented out](https://i.stack.imgur.com/nmm8z.png)