Я надеюсь реализовать алгоритм нечеткого совпадения в TSQL (без MDS), который сравнивает полные имена. Имена приходят от отдельных ручных вводов без контроля над тем, что было введено Одна из систем также имеет тенденцию обрезать конец имени, поскольку у нее низкий предел символов. В качестве экстремального примера данных, на которые я смотрю:
System1Name System2Name
----------- -----------
Katherine G Livingstone Kat George Livingst
Я определенно не ищу идеальное совпадение здесь, но, надеюсь, кто-то может порекомендовать алгоритм для чего-то вроде этого. Я изучил расстояние Джаро-Винклера и Саундекс, но я не уверен, что мне лучше использовать алгоритм на основе расстояний или фонетический алгоритм с данными такого рода. Мысли? * * 1004