У Access на самом деле нет инструментов для этого. В идеальном мире я бы использовал решение SSIS и использовал нечеткий поиск. Но если вы в настоящее время используете Access, шансы вашего офиса на покупку выпуска SQL Server Enterprise кажутся мне низкими. Если вы застряли в текущей среде, вы можете попробовать подход грубой силы.
Начните со стандартной очистки адресов. Выберите стандартные сокращения для улиц, улиц и т. Д. И напишите код, чтобы изменить все обычные варианты этих стандартных адресов. Замените все экземпляры двух пробелов одним пробелом, обрежьте все данные и удалите все не алфавитно-цифровые символы. Как видите, это довольно сложная задача.
Что касается названий компаний, возможно, вы можете попробовать сопоставить первые 5 символов имени и адреса или телефона. Вы также можете создать таблицу известных вариантов и того, с чем они будут связаны в вашей базе данных, чтобы использовать их для очистки будущих файлов. Так что если вы записываете с идентификатором 100 Acme, Inc., у вас может быть такая таблица:
Имя idfield
100 Acme, Inc.
100 Acme, Inc
100 Acme, Incorporated
100 Акме, ООО
100 Acme
Это начнется с небольшого размера, но будет со временем формироваться, если вы будете делать запись каждый раз, когда найдете и исправляете дубликат (сделайте его частью процесса удаления дубликатов), и если вы делаете запись каждый раз, когда сможете найти первое часть названия и адрес существующей компании.
Я бы также посмотрел на эту функцию, опубликованную Ториалом, и посмотрю, поможет ли это.
Все это будет болезненным и трудоемким, но со временем станет лучше, если вы найдете новые варианты и добавите их в код или список. Если вы решите стандартизировать свои адресные данные, сначала обязательно очистите производственные данные, затем выполните любой импорт в рабочую таблицу и очистите ее, а затем попытайтесь сопоставить с производственными данными и вставить новые записи.