Я пытаюсь пройти онлайн курс по науке о данных, и я очень плохо знаком с программированием на R. Мне поручено создать функцию, которая принимает три аргумента: каталог, загрязнитель и идентификатор, и она должна возвращать среднее значение загрязнителя, указанного в диапазоне требуемых идентификаторов. Ниже приведен код, который я застрял на
pollutantmean2 <- function(directory, pollutant, id){
library(dplyr)
a = "(Whatever Directory the files are located in)"
b = directory
wd = paste(a,b, sep = "/")
setwd(wd)
files = list.files()
csv = lapply(files,read.csv)
df = do.call(rbind,csv)
na_vec = which(!complete.cases(df))
valid_data = df[-na_vec, ]
id = group_by(valid_data,ID)
values = 0
mean_value = summarise(id,mean_sulfate = mean(sulfate),mean_nitrate = mean(nitrate))
}
Я думал о создании кадра данных, который содержит средние значения и использования диапазона, получая сумму среднего. Тем не менее, я в растерянности относительно того, как мне go сделать идентификатор в качестве диапазона. Я понял, что один из способов сделать это - создать вектор, скажем, x = c (1,2), но это требует от меня выбора вручную. Желаемый результат как этот пример