Soundex или аналогичный способ найти ошибочные дубликаты - PullRequest
0 голосов
/ 09 апреля 2019

Есть ли что-то похожее на Soundex, которое дает более близкие результаты?Например, у меня есть база данных, которая может иметь повторяющиеся адреса из-за опечаток ... например: «Гринридж Роуд» и «Гринбридж Роуд».Soundex возвращает слишком много результатов, которые не имеют отношения к делу.Что я могу использовать в SQL для поиска, может быть, первых 5 одинаковых символов?

Спасибо заранее!

Я также пытался использовать count (address.line1)> 1 Но это только верные результаты.Мне нужно что-то подобное, но выдает похожие результаты или учитывает, сколько символов я хочу сравнить.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...