Хранить почтовый адрес и предотвращать дублирование - PullRequest
0 голосов
/ 14 ноября 2010

У меня есть база данных, к которой я обращаюсь через Django & Python.Мы хотим хранить здания по их адресам (не по именам, поскольку у некоторых зданий просто нет названий).

Нам нужно запретить пользователям вводить дубликаты записей в нашу базу данных для того же здания.Это затрудняется тем, что люди могут вводить адреса (например, «1000 Main Street» против «1000 Main St.»)

Каким образом мы можем надежно предотвратить дублирование?Я использую базу данных MySQL.

Спасибо

Ответы [ 2 ]

0 голосов
/ 24 января 2012

Дедупликация адресов - сложная задача.Хотя с веб-службой USPS все в порядке, ей не хватает некоторых важных функций.Плюс, довольно неэффективно выполнять пакетную дедупликацию с использованием обычного веб-сервиса, выполнения запросов и т. Д.

И, похоже, USPS обновил свой сайт, поэтому ссылка, которую Дан разместил, хотя и полезна, теперьне работает.

В качестве обновленного ответа я хотел бы отметить, что я работаю на SmartyStreets и удаляем дубликаты из списков адресов.Например, вы можете загрузить свой список в CASS-Certified Scrubbing , и адреса будут стандартизированы и помечены для дубликатов.Таким образом, действительно просто.Если вам нужна проверка точки входа, взгляните на LiveAddress, который предоставляет более важную информацию, чем одна только служба USPS.

0 голосов
/ 14 ноября 2010

Если вы работаете только с США, вы можете использовать веб-службу стандартизации адресов USPS для устранения дубликатов:

http://www.usps.com/webtools/address.htm

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...