Краткое описание:
Мне любопытно посмотреть, смогу ли я использовать службы анализа SQL или некоторые другие службы SQL Server для сбора некоторых данных для меня, которые покажут общие черты между полями SQL TEXT в наборе данных.
Long Desc
Я рассматриваю подмножество данных, состоящее из примерно 10 000 строк BLOB-объектов TEXT, которые используются в качестве столбца примечаний в программном обеспечении отслеживания проблем (тикетов). Я хотел бы использовать что-то из коробки (без необходимости что-то создавать), которое могло бы быть в состоянии проанализировать все строки и найти часто используемые последовательности байтов в столбце «Заметки». Другими словами, я хочу найти часто используемые фразы (от двух до трех словосочетаний, то есть от 9 до 20 символьных разделов объекта TEXT). Это поможет мне лучше определить, содержат ли заметки сотрудника схожие фразы (методы устранения неполадок), которые мы могли бы стандартизировать в нашем процессе устранения неполадок.
Заключительная записка
Я бы действительно не хотел создавать приложение для этого, так как мой метод, вероятно, не будет самым эффективным способом сделать это.
В качестве альтернативы, если никто не знает о готовом решении, не могли бы вы порекомендовать какие-либо алгоритмы, которые я мог бы использовать в коде, где я мог бы проводить сравнения строк с массивом значений?
Надеюсь, все это имеет смысл. Пожалуйста, дайте мне знать в комментариях, если что-то нуждается в разъяснении.