Пример кода приведен ниже.
// Java
// Apache Beam SDK verison: 2.16.0
final TupleTag<TableRow> successTag = new TupleTag<TableRow>() {};
final TupleTag<TableRow> deadLetterTag = new TupleTag<TableRow>() {};
Pipeline p = Pipeline.create(dataflowOptions)
PCollection<String> input = p.apply("ReadS3File", TextIO.read().from("s3://sourceBucket/sourceFilename.csv"));
PCollectionTuple outputTuple = input.apply("StringToBigQueryTableRow", ParDo.of(new DoFn<String, TableRow>() { /**/ }))).withOutputTags(successTag, TupleTagList.of(deadLetterTag)))
Шаг ReadS3File застревает.
Я читаю документацию по потоку данных и изучаю дамп потока, кажется, он застрял на com.amazon aws .internal.SdkFilterInputStream.read
Указание по общей ошибке