Начальная точка:
У меня есть набор данных (таблица), который содержит множество переменных одного и того же класса (DBL).Они относятся к разным настройкам.Переменная (столбец в таблице) отсутствует.Это rowSum всех переменных, принадлежащих одному параметру.
Цель:
Моя цель - создать наборы данных с одинаковой структурой данных для каждого параметра, включая "rowSum" -Variable (я называю это "s1").
Проблема:
В каждой настройке есть разное количество переменных (и, конечно, они называются по-разному).Поскольку она должна иметь одинаковую структуру с разными переменными, это типичная ситуация для функции.
Вопрос:
Как решить проблему с помощью dplyr?
Я написалфункция для
(1) поднабора исходного набора данных для интересного параметра (работает), а
(2) для попытки суммировать переменные параметра (не работает; почему?),
Поскольку это функция для специально разработанного набора данных, эта функция включает в себя две предопределенные переменные:
день - любой день периода исследования
N - чтоКоличество дел, расследованных в этот особый день
Спасибо за любую помощь.
mkr.sumsetting <- function(...,dataset){
subvars <- rlang::enquos(...)
#print(subvars)
# Summarize the variables belonging to the interessting setting
dfplot <- dataset %>%
dplyr::select(day,N,!!! subvars) %>%
dplyr::mutate(s1 = rowSums(!!! subvars,na.rm = TRUE))
return(dfplot)
}