У меня конвейер Beam хорошо работает локально с DirectRunner.Однако при переключении на DataFlowRunner задание началось, и я могу видеть блок-схему из веб-интерфейса потока данных Google.Однако задание не запускается.Он висел там, пока я не прекратил работу.Я использую Beam 2.10.Я вижу автоматическую настройку масштабирования процессора и никаких исключений в журнале.
Я думаю, это как-то связано с тем, как я создаю файл Jar.Я использую теневой Jar для создания файла JAR в сборке Gradle.Основная причина использования ShadowJar - для mergeServiceFiles ().Если не использовать mergeServiceFiles (), задание будет выполняться с исключением, например Файловая система не найдена для gs .
Итак, я скопировал количество слов из репозитория шаблонов потока данных Google и упаковал их в файл jar.Это показывает то же самое, работа началась, но не движется.Код был изменен с минимальным изменением учетных данных учетной записи службы.Вместо исходных PipelineOptions я расширяю GcsOptions для учетных данных.
Пробный луч 2.12, 2.10.