Я пытаюсь понять правильное использование dplyr при суммировании вложенного списка в таблице.
Структура выглядит следующим образом:
> glimpse(mydata)
Rows: 1,000
Columns: 3
$ meta <df[,6]> <data.frame[40 x 6]>
$ independent_variable <list> [<"A", "B", "B", "B", "A", "A", "B", "A…
$ dependent_variables <df[,4]> <data.frame[40 x 4]>
> head(mydata$independent_variable)
[[1]]
[,1] [,2] [,3] [,4]
[1,] "A" "FALSE" "5" NA
[2,] "B" "FALSE" "5" "NA"
[3,] "B" "FALSE" "5" "NA"
[4,] "B" "FALSE" "5" "NA"
[5,] "A" "FALSE" "13" "NA"
[6,] "A" "FALSE" "5" "NA"
[7,] "B" "FALSE" "12" "NA"
[8,] "A" "FALSE" "133 "NA"
[9,] "A" "FALSE" "131 "NA"
[10,] "A" "TRUE" "0" "NA"
[[2]]
[,1] [,2] [,3] [,4]
[1,] "A" "FALSE" "77" NA
[2,] "B" "FALSE" NA "NA"
[3,] "B" "FALSE" NA "NA"
[4,] "B" "FALSE" NA "NA"
[5,] "B" "FALSE" NA "NA"
[6,] "A" "TRUE" "1" "NA"
переменная independent_variable представляет собой 1000 записей из N x 4 списков (то есть, все 1000 записей имеют 4 столбца и различное количество строк. Первый столбец - единственный столбец, который в данный момент заинтересован в просмотре, и каждый элемент может быть только "A" или "B") , Я хочу посчитать количество «А» в каждой из 1000 и вернуть это значение для каждой из 1000 записей.
кажется, что я должен использовать purrr, но я не уверен, как структурировать это в dplyr