Нечеткое совпадение SQL - общие имена и DOB - PullRequest
0 голосов
/ 26 апреля 2019

Я пытаюсь разработать подход, позволяющий сопоставить данные заявителя-арендатора с общедоступными записями.Нам требуется имя плюс одно из следующего: DOB, SSN, Address, DL.

Мы можем точно сопоставить имя + SSN, историю адресов, DL;Однако мы боремся с именем + DOB.Например, у нас может быть много Джозефа Смитов, родившихся 5/6/1972 в общедоступных данных.

Я пытаюсь разработать способ уменьшения количества случаев, которые переходят на ручное рассмотрение, когда у нас есть общее совпадение имя + DOB.Я рассчитываю разработать показатель достоверности для случаев (и, в конечном итоге, установить доверительный порог, чтобы отправлять случаи на проверку вручную или автоматически подтверждать соответствие).

Есть совет?Идеи?(Я думал о некоторой уверенности, основанной на популярности названия по году) С чего начать?

...