Я пытаюсь разделить мой конвейер на множество меньших конвейеров, чтобы они выполнялись быстрее.Я делю PCollection BLOB-объектов Google Cloud Storage (PCollection) так, чтобы я получил оттуда
PCollectionList<Blob> collectionList
, и я хотел бы получить что-то вроде:
Pipeline p2 = Pipeline.create(collectionList.get(0));
.apply(stuff)
.apply(stuff)
Pipeline p3 = Pipeline.create(collectionList.get(1));
.apply(stuff)
.apply(stuff)
Но яЯ не нашел никакой документации о создании начальной PCollection из уже существующей PCollection, я был бы очень признателен, если кто-нибудь может указать мне правильное направление.Спасибо!