Question

Я надеюсь реализовать алгоритм нечеткого совпадения в TSQL (без MDS), который сравнивает полные имена. Имена приходят от отдельных ручных вводов без контроля над тем, что было введено Одна из систем также имеет тенденцию обрезать конец имени, поскольку у нее низкий предел символов. В качестве экстремального примера данных, на которые я смотрю:

System1Name                System2Name
-----------                -----------
Katherine G Livingstone    Kat George Livingst

Я определенно не ищу идеальное совпадение здесь, но, надеюсь, кто-то может порекомендовать алгоритм для чего-то вроде этого. Я изучил расстояние Джаро-Винклера и Саундекс, но я не уверен, что мне лучше использовать алгоритм на основе расстояний или фонетический алгоритм с данными такого рода. Мысли? * * 1004

Алгоритм нечеткого совпадения полных имен из разных ручных вводов в TSQL?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Алгоритм нечеткого совпадения полных имен из разных ручных вводов в TSQL?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы