Я планирую подготовить конвейер данных без сервера с помощью Google Cloud Platform.Я планирую использовать Dataflow / Dataproc для пакетной обработки данных из трех разных источников.
Мои источники ввода:
- Cloud SQL (MySQL)
- Cloud SQL(PostgreSQL)
- MongoDB
Но после прочтения их документации я получил, что они не имеют никакого ввода для облачного SQL или MongoDB.
Также я проверил их раздел пользовательских драйверов, но это только для Java, но я планирую использовать Python.
Есть ли какие-либо идеи, как я могу использовать эти 3 различных источника с потоком данных/ Dataproc?