у меня есть:
- Правильный числовой идентификатор, такой как номер телефона / номер социального страхования / и т. Д.
- Другое число из какой-либо формы ввода данных
2-й номер похож, но не равен 1-му.
Оба числа действительны.
Я хочу вычислить, насколько вероятно, что 2-е число фактически является ошибкой ввода 1-го числа.
Такие ошибки могут включать в себя:
- Выключено несколькими цифрами
- Транспонированные цифры
- Неверно истолкованные цифры (1-7, 4-9, 3-8, 2-5)
Кто-нибудь знает о существовании такого алгоритма / кода?
Edit:
Я не ищу общий алгоритм сходства строк. Я ищу алгоритм, оптимизированный для ошибок ввода чисел человеком, или для некоторых исследований по этой теме.