Профилирование на уровне символов в службах SSIS или SQL Server - PullRequest
0 голосов
/ 22 июля 2011

Мне нужно профилировать справочные поля в базе данных, чтобы понять шаблоны, из которых они состоят. Это необходимо сделать на уровне символов, так как в ссылочных полях не будет пробелов или знаков препинания.

В качестве примера я ищу решение, которое будет принимать следующие данные:

ABA1235DV6778 ABA1235DV6788 ABA2335DV6778

И предложить шаблоны, такие как:

ABA \ d \ d35DV67 \ d \ d

Это будет использоваться для дальнейшей проверки этих справочных полей, как только я смогу понять допустимые значения в этих столбцах.

Я рассмотрел функцию профилирования в SSIS, но, похоже, в ней нет детализации. Кто-нибудь знает, как я могу настроить профилирование в SSIS 2008 или есть эффективная функция для SQL Server 2008, которую можно использовать для достижения этой цели?

Любая помощь будет принята с благодарностью,

Найл

1 Ответ

1 голос
/ 22 июля 2011

Из вашего поста не совсем ясно, какую логику вы хотите применить к строкам. Я предполагаю, что вы хотите использовать некоторую форму вычисления edit distance для идентификации похожих строк, а затем генерирует регулярное выражение , которое соответствует всем им. Обычно это задачи, которые могут быть реализованы во внешней программе, написанной на соответствующем языке, а не в SSIS или SQL Server. Это, конечно, не то, что вы можете сделать с уже существующими функциями SSIS.

Так что я бы на время забыл SSIS и разработал наилучший способ реализации вашего алгоритма в .NET (или на любом другом языке, который вам удобен). После того, как вы это сделали, вы можете решить:

  • Напишите автономный исполняемый файл и вызовите его из задачи «Выполнение процесса»
  • Написать .NET DLL и использовать ее в задачах сценариев, компонентах сценариев или хранимых процедурах CLR
  • Напишите свой собственный компонент SSIS
  • Напишите полную программу вместо использования SSIS
...