Таким образом, Trifacta (CDP) может либо добавлять, заменять или создавать новый файл при каждом запуске задания. Вы ссылаетесь на действие Upsert \ Merge. Таким образом, это можно сделать за 2 шага.
- для новых строк, вы можете использовать опцию запуска "append"
- для обновления существующих строк - 2 варианта .
Либо - A. выполните преобразование объединения с выходным файлом (уже в большом запросе), затем дедуплицируйте \ aggregate и выберите способ объединения между дублированными строками. это может быть сделано каждый раз, когда новый файл создается \ создается \ обновляется. B. создайте новый файл, затем с помощью параметризации импортируйте все файлы в папке - объедините их и выполните группировку, указанную в A .
Очевидно - опция A кажется более просто c.
Имеет ли это смысл?