Я работал с Double Metaphone и Caverphone2 для сравнения строк, и они хорошо работают с такими вещами, как имена, адреса и т. Д. (Caverphone2 работает лучше всего для меня).Тем не менее, они дают слишком много ложных срабатываний, когда вы получаете числовые значения, такие как номера телефонов, IP-адреса, номера кредитных карт и т. Д.и Verhoeff алгоритмы, и они описывают в основном то, что я хочу, но не совсем.Они кажутся хорошими в проверке, но, похоже, не созданы для нечеткого сопоставления.Есть ли что-нибудь, что ведет себя как Лун и Верхофф, который может обнаруживать однозначные ошибки и ошибки транспонирования, включающие две соседние цифры, для целей кодирования и сравнения, аналогично алгоритмам нечеткой строки?число, затем сравните его с 100 000 других чисел, чтобы найти близко совпадающие совпадения.Таким образом, что-то вроде 7041234 будет соответствовать 7041324 в качестве возможной ошибки транскрипции, а что-то вроде 4213704 - нет.