Переименование значений в столбцах с помощью r - PullRequest
0 голосов
/ 03 марта 2020

У меня есть фрейм данных с нечистыми данными (это типично верно). Поэтому я пытаюсь переименовать их в общие ценности. Так что все, что похоже на SF или Bay Area или San Francisco, должно быть San Francisco. Точно так же и для New York. Как я могу это сделать? Ниже показано, как выглядят мои данные

datapasta::dpasta(df)
c("US", "US", "SF", "NYC", "LA", "BOS", "San Francisco", "NYC", "LA", "BOS", "Bay Area", "NYC", "LA", "BOS", "SF", "SFO", "LA", "BOS", "SF", "SF", "SF", "SF", "SF", "New York", "NYC", "NYC", "NYC", "NYC", "Boston", "BOS")

1 Ответ

0 голосов
/ 03 марта 2020

Вы можете использовать case_when для этого:

library(dplyr)
df <- c("US", "US", "SF", "NYC", "LA", "BOS", "San Francisco", "NYC", "LA", "BOS", "Bay Area", "NYC", "LA", "BOS", "SF", "SFO", "LA", "BOS", "SF", "SF", "SF", "SF", "SF", "New York", "NYC", "NYC", "NYC", "NYC", "Boston", "BOS")

df <- case_when(
  df %in% c("SF", "Bay Area") ~ "San Francisco",
  df %in% c("NYC") ~ "New York",
  TRUE ~ df
)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...