Я думаю о создании гибридной облачной установки на своем рабочем месте. Прямо сейчас у нас есть задания машинного обучения, работающие в кластере Spark на AWS. То, что я хочу сделать, - это иметь возможность подключаться к этому кластеру из задания Airflow, запущенного на GCP, для вызова различных заданий по мере необходимости и выполнения других задач.
Я не знаю, как это сделать , хоть. Я мог бы создать общедоступный c DNS для кластера Spark, который позволил бы легко подключаться из GCP через Inte rnet, но я предполагаю, что это не идеально для безопасности.
Нужно ли настроить VPN между проектом GCP (т.е. GCP VP C) и AWS VP C? Если так, как я могу это сделать? Я не хочу использовать сторонний продукт, если есть способ сделать это с помощью vanilla GCP и конфигурации AWS.
В принципе, я думаю, что мне нужно, чтобы работа на GCP могла увидеть внутренний DNS кластера Spark и использовать его для подключения, но опять же я не знаю, как это сделать.