Я могу говорить только исходя из своего опыта работы с SSIS, поэтому я прошу прощения, если это будет лишь незначительно полезным.
С точки зрения общей санитарии, я не сталкивался с каким-либо целевым компонентом дляэта работа.Я предполагаю, что это связано с тем, что разные сценарии могут иметь совершенно разные определения «плохих данных», но такие вещи, как удаление непечатных символов, могут быть обычным бизнес-требованием, так что это несколько удивительно.
Естественновы всегда можете воспользоваться преобразованием производного столбца или, в более сложных случаях, компонентом сценария, но это вряд ли делает логику репликации между пакетами безболезненной.Есть случаи, когда мы использовали CozyRoc компоненты для создания сценариев, которые мы могли бы совместно использовать между пакетами, но помимо того, что у нас фактически был доступ к этим компонентам в первую очередь, это все еще предполагает определенный уровеньнастраивать каждый раз, когда вам нужна функциональность.
Так что в подобных случаях я лично считаю, что лучшим вариантом является объединение ваших общих процедур санитарии в настраиваемый компонент потока данных .Мы разработали один для себя, чтобы обрабатывать некоторую очень распространенную логику проверки данных, и настроить редактор компонентов так, чтобы вы могли выбирать флажки для включения тех проверок, которые вы хотели применить к данному столбцу.Тогда это просто становится вопросом перетаскивания и подключения вашего потока данных.По крайней мере, для нас определенно стоило потратить время на разработку компонента.
Я не знаю, что DTS предлагает в этом отношении (я думаю, что он довольно ограничен или, по крайней мере, не дружелюбен, но я мог быошибаться), так что это, вероятно, не полезно для ваших старых пакетов.Я чувствую, что решение Кейда, вероятно, было бы наиболее свободным от стресса в этом случае, при условии, что оно осуществимо для ваших входных данных.
Что касается общего понимания SSIS, я нашел блоги Джейми Томсона (ранее здесь ) очень полезно, поэтому вы можете проверить, не обсуждал ли он эту конкретную тему раньше.
В любом случае, надеюсь, это было хотя бы немного полезно, иудачи в решении проблемы.
На заметку : Слава за то, что вы захотите очистить ваши данные перед тем, как поместить их в вашу базу данных.Мы получаем данные от конкретного поставщика, который не никогда не очищает свои данные, а затем пытается отправить их в XML, чтобы отправить их нам через веб-сервис.Излишне говорить, что синтаксический анализатор XML не слишком любит непечатные символы.