У меня есть набор данных, содержащий названия городов штатов (например, Нью-Йорк, Нью-Йорк), но некоторые названия локаций не верны.Бывают случаи, когда в месте с ошибкой указано место или отсутствуют пробелы (например, NY NEWW YORK или NY NEWYORK).У меня есть файл Excel со всеми правильными названиями городов, и мне интересно, есть ли способ выполнить какой-либо тип поиска этого файла и внести исправления в мой сценарий R.
Мой эталонный файл Excel настроеннапример:
CurrentOrigin CorrectOrigin
NY NEW YORK NY NEW YORK
NY NEWW YORK NY NEW YORK
Я пытался написать заявление if, но безуспешно.
Мои навыки в R ограничены, но я делаю успехи каждый день.
if (df$Origin == df2$CurrentOrigin) {
df2$CorrectOrigin ##not sure what to put in the statement
}
Любая помощь будет отличной!Заранее спасибо!