Я новичок в R и анализе данных. У меня есть база данных, похожая на приведенную ниже, только намного больше, и я пытался найти общий способ подсчета для каждой страны, сколько существует действий и сколько подзапросов со значением 1, значением 2 и так далее. Для каждого действия есть несколько вопросов, подвопросов и подвопросов, но я бы хотел найти способ подсчитать
1: сколько действий в каждой стране, исключая подвопросы
2: способ узнать, сколько подзапросов 1 или 2 со значением 1 существует для каждой страны, actionn и questionn.
id country questionn subquestion value actionn
06 NIE 1 1 1 1
05 NIG 1 1 1 1
07 TAN 1 1 1 1
08 BEN 1 1 1 1
03 TOG 1 1 2 1
45 MOZ 1 1 2 1
40 ZIM 1 1 1 1
56 COD 1 1 1 1
87 BFA 1 1 1 1
09 IVC 1 1 2 1
08 SOA 1 1 2 1
02 MAL 1 1 2 1
78 MAI 1 1 2 1
35 GUB 1 1 2 1
87 RWA 1 1 2 1
41 ETH 1 1 1 1
06 NIE 1 2 2 1
05 NIG 1 2 1 1
87 BFA 1 2 1 2
Я попытался создать подмножества фрейма данных и посчитать все для каждой страны по одному, но это займет вечность, и мне было интересно, есть ли общий способ сделать это.
Для первого вопроса я сделал это
df1<-df %>% group_by (country) %>% summarise (countries=county)
unique(df1)
count(df1)
Что касается второго вопроса, я думал об индивидуальном отборе и подсчете каждой строки, у которой задано Вопросы: n = 1, подзапрос = 1, значение = 1 и действие n = 1, затем выберите и посчитайте, сколько в стране с qurationn = 1, подзапрос n = 2, значение = 1, actionn = 1 и т. Д. Значение означает, является ли ответ на вопрос 1 = да или 2 = нет.
Буду признателен за любую помощь, большое спасибо:)