Как объединить два набора данных с частично совпадающими элементами - PullRequest
0 голосов
/ 24 марта 2020

Я должен объединить данные, содержащиеся в двух разных наборах данных.

Первый набор данных "Patrol" сообщает об автомобилях, принадлежащих вымышленной компании, а второй "aci.database" - их стоимость владения.

Проблема в том, что имена, используемые для автомобилей в "Patrol", отличаются от имен, используемых в "aci.database"

например, Patrol , например, aci.database

Вы видите, что, например, фокус не имеет "Форд", указанный в Patrol, но все они, кроме Seat Ibiza, написаны по-другому.

Я пытался унифицировать все имена с этой функцией:

stringCleaning <- function(x) {
#   x <- stringr::str_trim(x)
#   x <- tolower(x)
#   x <- gsub("\\s+", " ", x)
#   x <- gsub("/^[a-zA-Z0-9 ]+$/", "", x)
  stringr::str_trim(tolower(gsub("\\s+", " ", gsub("/^[a-zA-Z0-9 ]+$/", "", x))))}

и, конечно, для «ручного» изменения имен, но мне нужна автоматизированная версия в случае изменения «Patrol».

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...