Я работаю над следующим набором данных актерского года, где информация о странах задается переменной, где каждая страна отделена запятой.
dt_initial <- data.frame(actor=c("Actor1","Actor1", "Actor2","Actor3"),year=c(2017,2018,2019,2020),
country=c("Country1", "Country1", "Country1, Country2", "Country1, Country2, Country3"),
amount=c(10,20,70,90))
> dt_initial
actor year country amount
1 Actor1 2017 Country1 10
2 Actor1 2018 Country1 20
3 Actor2 2019 Country1, Country2 70
4 Actor3 2020 Country1, Country2, Country3 90
Я хотел бы преобразовать этот набор данных в набор данных страны-года, в котором у меня будет ряд для каждой страны. Кроме того, я хотел бы, чтобы переменная «сумма» была разделена на число стран, указанных в каждой строке из исходного набора данных. Таким образом, мой последний набор данных будет
dt_final <- data.frame(actor=c("Actor1", "Actor1","Actor2","Actor3", "Actor2", "Actor3", "Actor3"),year=c(2017, 2018, 2019,2020, 2019, 2020, 2020),
country=c("Country1", "Country1", "Country1", "Country1", "Country2", "Country2", "Country3"),
amount=c(10, 20,35,30, 35, 30, 30))
> dt_final
actor year country amount
1 Actor1 2017 Country1 10
2 Actor1 2018 Country1 20
3 Actor2 2019 Country1 35
4 Actor3 2020 Country1 30
5 Actor2 2019 Country2 35
6 Actor3 2020 Country2 30
7 Actor3 2020 Country3 30
Большое спасибо заранее за вашу помощь!