Я надеюсь получить рекомендации по настройке --environment_config
при запуске демо-версии Beam wordcount.py.
Он работает нормально с DirectRunner. Счетчик слов у Флинка также работает нормально (т.е. запускает Флинк через flink run
).
Я бы хотел запустить Beam, используя бегунок Flink, используя «отдельный кластер Flink», как описано в документации пучка ,Я не могу использовать Docker, поэтому я планирую использовать --environment_type=PROCESS
.
Я использую следующее в коде python для установки environment_config:
environment_config = dict()
environment_config['os'] = platform.system().lower()
environment_config['arch'] = platform.machine()
environment_config['command'] = 'ls'
ec = "--environment_config={}".format(json.dumps(environment_config))
Очевидно, что команда неверна. Когда я запускаю это, Flink получает и успешно обрабатывает подзадачи DataSource
. Это в конечном итоге тайм-ауты на CHAIN MapPartition
с.
Может ли кто-нибудь предоставить руководство (или ссылки) о том, как установить environment_config? Я использую Beam в контейнере Singularity.