Поиск общих фраз в текстовом столбце SQL Server - PullRequest
0 голосов
/ 27 апреля 2010

Краткое описание:

Мне любопытно посмотреть, смогу ли я использовать службы анализа SQL или некоторые другие службы SQL Server для сбора некоторых данных для меня, которые покажут общие черты между полями SQL TEXT в наборе данных.

Long Desc

Я рассматриваю подмножество данных, состоящее из примерно 10 000 строк BLOB-объектов TEXT, которые используются в качестве столбца примечаний в программном обеспечении отслеживания проблем (тикетов). Я хотел бы использовать что-то из коробки (без необходимости что-то создавать), которое могло бы быть в состоянии проанализировать все строки и найти часто используемые последовательности байтов в столбце «Заметки». Другими словами, я хочу найти часто используемые фразы (от двух до трех словосочетаний, то есть от 9 до 20 символьных разделов объекта TEXT). Это поможет мне лучше определить, содержат ли заметки сотрудника схожие фразы (методы устранения неполадок), которые мы могли бы стандартизировать в нашем процессе устранения неполадок.

Заключительная записка

Я бы действительно не хотел создавать приложение для этого, так как мой метод, вероятно, не будет самым эффективным способом сделать это.

В качестве альтернативы, если никто не знает о готовом решении, не могли бы вы порекомендовать какие-либо алгоритмы, которые я мог бы использовать в коде, где я мог бы проводить сравнения строк с массивом значений?

Надеюсь, все это имеет смысл. Пожалуйста, дайте мне знать в комментариях, если что-то нуждается в разъяснении.

1 Ответ

1 голос
/ 28 апреля 2010

Вы можете использовать преобразования интеллектуального анализа текста в службах интеграции SQL Server (выпуски Enterprise и Dev) для поиска терминов и извлечения терминов, а затем использовать правила ассоциации в службах аналитики для построения модели ассоциации терминов. Существует учебник по старению , который все еще должен работать (требуется бесплатный вход)

Мы объявим о чем-то связанном с этим позже в этом году - вы можете оставить отзыв на нашем сайте (predixionsoftware.com), если вы заинтересованы в бета-тестировании.

- Джейми МакЛеннан технический директор Программное обеспечение Predixion

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...