Apache Beam - чтение всех файлов из каталога - PullRequest
0 голосов
/ 18 декабря 2018

У меня есть конвейер потока данных, в котором я использую приведенный ниже метод AvroIO для чтения определенного файла avro с известной схемой.

Однако я хотел бы прочитать все файлы в каталоге, соответствующие расширению файла.шаблон рекурсивно в конвейере вместо чтения одного файла .. Нужна помощь в этом

pipeline.apply("Read from Avro",
 AvroIO.readGenericRecords(schema).from("gcs://test/test.avro")

1 Ответ

0 голосов
/ 17 апреля 2019

Как подсказал @Kolban, "from ()" принимает подстановочные знаки, как эта строка предполагает в исходном коде.

...