У меня есть data.frame следующей структуры, с несколькими переменными и тысячами записей.
> data <- data.frame(country_code=c("AT12", "AT23", "AT33", "BG01", "BG45", "FR11", "FR23"), year=c("2000", "2001", "2000", "2005", "2007","2005","2000"))
Я бы хотел сгруппировать все записи / регионы в определенную региональную группу и перечислить все эти группы в одном столбце, чтобы конечный результат выглядел следующим образом:
> data_grouped <- data.frame(country_code=c("AT12", "AT23", "AT33", "BG01", "BG45", "FR11", "FR23"), year=c("2000", "2001", "2000", "2005", "2007","2005","2000"), groups=c("Gr1", "Gr1", "Gr1", "Gr1", "Gr1", "Gr2", "Gr2")).
В основном я создаю региональные манекены.
Несколько регионов разных стран будут отнесены к определенной группе.
Я попробовал следующий подход, но проблема в том, что последующая команда перезаписывает предыдущую.
> data_grouped$groups=grepl("AT",data_grouped$country_code)
> data_grouped$groups=ifelse(data_grouped$groups1=="TRUE","Gr1","")
> data_grouped$groups=grepl("BG",data_grouped$country_code)
> data_grouped$groups=ifelse(data_grouped$groups1=="TRUE","Gr1","")
> data_grouped$groups=grepl("FR",data_grouped$country_code)
> data_grouped$groups=ifelse(data_grouped$groups1=="TRUE","Gr2","")
Пожалуйста, сообщите, как я могу противодействовать перезаписи.
Большое спасибо заранее!