поэтому у меня есть эти DAG Airflow, состоящие из нескольких задач. По сути, каждая задача выполняет несколько независимых этапов анализа для данного фрагмента кода, и, наконец, решается, можно ли использовать этот фрагмент с нормативной точки зрения.
Каждая задача - в зависимости от фрагмента кода - довольно короткая (максимум 1-25 минуты) и в основном сводится к выполнению какого-либо внешнего инструмента анализа (с открытым исходным кодом и внутри) и обработке выходных данных этого инструмента.
Все это прекрасно работает на моей машине для разработки, но, поскольку мы анализируем довольно много фрагментов кода в рабочее время (~ 50 в час), а не в нерабочее время, я хотел бы получить все это и работает где-то в облаке (мне все равно, если на Google Cloud, AWS или Azure).
Итак, мой вопрос, каков был бы экономичный способ запуска и запуска в облаке? Я думал об использовании облачного компоновщика Google и этих виртуальных виртуальных машин (которые отключаются случайным образом, но стоят очень дешево), но кажется, что я не могу использовать PVM вместе с облачным компоновщиком.
Поскольку различные этапы в группе обеспечения доступности баз данных независимы, PVM будут хороши для IMO - если во время выполнения задачи они будут закрыты, я просто повторю эту задачу на другом PVM.
Спасибо