Вставить в таблицу Postgres, используя Pyspark DataFrames и соединение JDB C - PullRequest
0 голосов
/ 06 августа 2020

Я пытаюсь выполнить Upsert на почтовых отправлениях. У меня есть таблица postgres, в которой есть миллионы записей. Если в нее приходят какие-либо обновления, я хочу обновить существующие записи и вставить новые записи с помощью PySpark. Нашел 1 статью о том же с использованием java, но мне кажется, что это бесполезно. https://medium.com/@thomaspt748 / how-to-upsert-data-into-relational-database-using- apache -spark-part-2-45a9d49d0f43

У меня здесь несколько похожий вопрос но никто не ответил на него.

Обновление в таблице СУБД (Mysql) с использованием Pyspark DataFrames и JDB C

Любая помощь приветствуется !!

...