Вы не можете реально реализовать метод SQL MERGE в s3, так как невозможно обновить существующие объекты данных.
Обходной путь - загрузить существующие строки в задании Glue, объединить их с входящим набором данных, удалить устаревшие записи и перезаписать все объекты на s3.Если у вас много данных, было бы более эффективно разделить их на несколько столбцов, а затем переопределить те разделы, которые должны содержать только новые данные.
Если ваша цель - предотвратить дублирование, вы можете сделать то же самое: загрузить существующийудалите те записи из входящего набора данных, которые уже существуют в s3 (загружены на предыдущем шаге), а затем запишите в s3 только новые записи.