Вы можете попробовать использовать приблизительный "grep" - agrep()
:
Начните с некоторых городов-примеров:
cities <- c("New Yark", "New York City", "Nevada", "California", "new york", "New Amsterdam", "Naw York")
Получите имена, которые примерно соответствуют "Нью-Йорку" (у вас будет играть с max.dist
параметром)
inds <- agrep("New York", cities, max.dist=0.2)
Вот те, которые соответствуют этому случаю:
cities[inds]
[1] "New Yark" "New York City" "new york" "Naw York"
Давайте изменим их:
cities[inds] <- "New York"
cities
[1] "New York" "New York" "Nevada" "California" "New York" "New Amsterdam" "New York"