В целом, для локального переносного бегуна (ULR) см. Вики , цитата оттуда:
Запуск конвейера Python-SDK:
- Компиляцияконтейнер как локальная сборка:
./gradlew :beam-sdks-python-container:docker
- Запустить сервер заданий ULR, например:
./gradlew :beam-runners-reference-job-server:run -PlogLevel=debug -PvendorLogLevel=warning
.Для получения дополнительной информации см. Раздел Java в приведенной выше ссылке.3 Настройте среду Python правильно.Подробнее можно найти здесь . - Запустить конвейер, используя следующие (в папке sdk / python),
пример:
python -m apache_beam.examples.wordcount\
--input=gs://dataflow-samples/shakespeare/kinglear.txt \
--output=/tmp/output \
--runner=PortableRunner \
--job_endpoint=localhost:8099 \
--experiments beam_fn_api
Для Flink вам нужно использовать другой сервер заданий:./gradlew beam-runners-flink_2.11-job-server:runShadow
.Хост: порт: localhost:8099
,
Соответствующие обсуждения по электронной почте: one , two .
Возможно, стоит посмотреть какой-нибудь код: один , два .