Я пытаюсь выполнить Upsert на почтовых отправлениях. У меня есть таблица postgres, в которой есть миллионы записей. Если в нее приходят какие-либо обновления, я хочу обновить существующие записи и вставить новые записи с помощью PySpark. Нашел 1 статью о том же с использованием java, но мне кажется, что это бесполезно. https://medium.com/@thomaspt748 / how-to-upsert-data-into-relational-database-using- apache -spark-part-2-45a9d49d0f43
У меня здесь несколько похожий вопрос но никто не ответил на него.
Обновление в таблице СУБД (Mysql) с использованием Pyspark DataFrames и JDB C
Любая помощь приветствуется !!