Мы работаем над очисткой и анализом большого количества введенных человеком данных о клиентах. Нам необходимо программно решить, являются ли 2 адреса (например) одинаковыми, даже если данные вводились с небольшими изменениями.
Прямо сейчас мы проводим каждый адрес через довольно упрощенную замену строк (например, заменяя avenue на ave), объединяем поля и сравниваем результаты. Мы делаем что-то похожее с именами.
По крайней мере, кажется, что наш список значений поиска-замены уже должен где-то существовать.
Или, может быть, вы можете предложить совершенно другой и превосходный способ обнаружения совпадений?