Я надеюсь, что кто-то сможет прояснить связь между TensorFlow и его зависимостями (Beam, AirFlow, Flink и т. Д.)
Я ссылаюсь на главную страницу TFX: https://www.tensorflow.org/tfx/guide#creating_a_tfx_pipeline_with_airflow и т. Д.
В примерах я вижу три варианта: https://github.com/tensorflow/tfx/tree/master/tfx/examples/chicago_taxi_pipeline taxi_pipeline_flink.py
, taxi_pipeline_kubeflow.py
, taxi_pipeline_simple.py
Пример BEAM?
НетПример "ЛУЧ" и немного описания его использования.
Правильно ли считать, что taxi_pipeline_simple.py
будет работать, даже если не установлен воздушный поток?Я думаю, что нет, поскольку он использует «AirflowDAGRunner».Если нет, то можете ли вы запустить TFX только с BEAM и его бегуном?Если да, то почему нет такого примера?
Пример Flink
В taxi_pipeline_flink.py
, используется AirflowDAGRunner.Я предполагаю, что использует AirFlow в качестве оркестратора, который в свою очередь использует Flink в качестве исполнителя.Правильно?
Пример воздушного потока
На странице указано, что BEAM является обязательной зависимостью, но в воздушном потоке нет луча в качестве одного из исполнителей.Он имеет только SequentialExecutor, LocalExecutor, CeleryExecutor, DaskExecutor и KubernetesExecutor.Следовательно, BEAM нужен только тогда, когда не используется Airflow ?При использовании воздушного потока, какова цель луча, если он необходим?
Спасибо за любые идеи.