Итак, я выполняю процесс etl, в котором я использую Apache NiFi в качестве инструмента etl вместе с базой данных postgresql из google cloud sql для чтения csv-файла из GCS. В рамках этого процесса мне нужно написать запрос для преобразования данных, считываемых из файла CSV, и вставки их в таблицу в облачной базе данных SQL. Итак, на основе NIFi мне нужно написать Python для автоматического выполнения SQL-запросов на ежедневной основе. Но вопрос здесь заключается в том, как я могу написать Python для соединения с облачной базой данных SQL? Какой конфиг что надо сделать? Я прочитал что-то о прокси-сервере cloud sql, но могу ли я просто использовать внутренний ip-адрес экземпляра cloud sql и поместить его в какой-нибудь файл конфигурации и создать из него какой-нибудь dbconnector?
Спасибо
Редактировать: я могу подключиться к облачной базе данных sql из моего виртуального компьютера, используя psql -h [CLOUD_SQL_PRIVATE_IP_ADDR] -U postgres
, но мне нужно запустить скрипт python для процесса etl, и есть часть процесса, которая должна выполнить sql. Я пытаюсь спросить, как я могу написать файл Python, который используется для выполнения sql
например. В python, query = 'select * from table ....'
, а затем запустить
postgres.run_sql(query)
, который выполнит запрос. Так как я могу создать такого исполнителя?