Извлечение идентификатора страны и присвоение его региональной группе - PullRequest
0 голосов
/ 03 сентября 2018

У меня есть data.frame следующей структуры, с несколькими переменными и тысячами записей.

  > data <- data.frame(country_code=c("AT12", "AT23", "AT33", "BG01", "BG45", "FR11", "FR23"), year=c("2000", "2001", "2000", "2005", "2007","2005","2000"))

Я бы хотел сгруппировать все записи / регионы в определенную региональную группу и перечислить все эти группы в одном столбце, чтобы конечный результат выглядел следующим образом:

  > data_grouped <- data.frame(country_code=c("AT12", "AT23", "AT33", "BG01", "BG45", "FR11", "FR23"), year=c("2000", "2001", "2000", "2005", "2007","2005","2000"), groups=c("Gr1", "Gr1", "Gr1", "Gr1", "Gr1", "Gr2", "Gr2")). 

В основном я создаю региональные манекены.

Несколько регионов разных стран будут отнесены к определенной группе. Я попробовал следующий подход, но проблема в том, что последующая команда перезаписывает предыдущую.

> data_grouped$groups=grepl("AT",data_grouped$country_code)
> data_grouped$groups=ifelse(data_grouped$groups1=="TRUE","Gr1","")
> data_grouped$groups=grepl("BG",data_grouped$country_code)
> data_grouped$groups=ifelse(data_grouped$groups1=="TRUE","Gr1","")
> data_grouped$groups=grepl("FR",data_grouped$country_code)
> data_grouped$groups=ifelse(data_grouped$groups1=="TRUE","Gr2","")

Пожалуйста, сообщите, как я могу противодействовать перезаписи. Большое спасибо заранее!

...