Привет! В настоящее время я пытаюсь оптимизировать пакет служб SSIS, когда выполняю операцию Upsert / Delete, которая обрабатывает около 93+ миллионов строк из таблицы в удаленном источнике MariaDB.
Таблица также содержит приблизительно 63 столбца.
В настоящее время я использую Sort and Merge Join в своем пакете, но, как я прочитал, некоторые руководства рекомендуют выполнять сортировку на сервере, а не с помощью функции сортировки в SSIS DT, так как это создает нагрузку на Память сервера служб SSIS.
И поскольку в настоящее время я использую это решение в Azure Data Factory, запуск пакета завершается сбоем (чаще всего это время ожидания, хотя я увеличил свойства Time Out как на стороне пакета, так и на фабрике данных Azure).
Каков рекомендуемый способ решения этой проблемы?
Если я правильно понял и, как я уже говорил, я могу пропустить загрузку на сервере SISS, отсортировав DB-Server-Side. Но так как я новичок во всем, что касается SQL и SSIS, я не совсем уверен, как это будет выглядеть в SQL-команде.
Также я думаю о пакетировании, но даже здесь я не уверен, как это будет работать в SSIS.
Что здесь рекомендуется?
Мой пакет служб SSIS выглядит следующим образом:
Я следовал примеру такого типа: Синхронизация табличных данных с помощью объединения слиянием в SSIS
(К вашему сведению: красные значки ошибок присутствуют, потому что я потерял соединение во время скриншота, в противном случае это полностью рабочее решение.)