Расстояние jaro-winkler было разработано для поиска проблем с вводом данных.Но для записей только 2 длинных это будет трудно, так как 1 ошибка имеет тенденцию набирать больше очков, чем вы хотите.Вы можете комбинировать это с другими измерениями расстояния, доступными в пакете stringdist.Но в этом случае это может быть слишком сложно.
Учитывая ваши примеры, вы можете использовать базовую функцию chartr
и настроить замену цифр на буквы.
chartr("01","OL", V2)
[1] "PL" "PL" "PL" "XX"
chartr("01","OL", V)
[1] "PO" "PO" "PO"
Это всегда заменит 1 на L, а 0 (ноль) на O. Вы можете добавить 5 для S и т. Д. И т. Д. Но если есть другие комбо, это может усложниться.
Также обратите внимание, что следующей итерацией дедуктивного пакета является дедуктивный пакет.