Я абсолютный новичок в R - перебираю свой путь для получения степени :)
Мне нужно обобщить очень большой набор данных по сайту, так как в настоящее время существует несколько строк на сайт и около 70столбцы переменных - как числовые, так и категориальные.Я смотрю на регенерацию рассады на каждом участке.
У меня 45 учебных площадок, и я пытаюсь суммировать все мои переменные для каждого сайта.в настоящее время - на каждом из исследуемых участков имеется несколько видов растений в диапазоне от 5 до 30 + =>, поэтому я могу иметь до 30 рядов для каждого участка, поскольку каждый новый вид на участке имеет свой собственный ряд с #trees, # saplings #, саженцы, другие переменные в виде столбцов.
я пробовал этот код:
i <- sapply(data.df, is.factor) ### convert "factor" variables to "character" for dply analysis
data.df[i] <- lapply(data.df[i], as.character)
select(data.df,site,total_seedlings_m2,age,age_category,landuse_history, exotic_landcover_types,native_landcover_types,prcnt_light_transmittance,avg_canopy_height,prcnt_total_herb_cover,annual_rainfall_mm,annual_sunshine_hours,annual_temp_mean,annual_ground_frost_days,annual_rel_humidity,daily_air_rh_range,daily_air_temp_range,daily_soil_temp_range,total_trees_m2,total_basal_area_m2)
group_by_(site)
summarise_all(data.df)
я хочу суммировать все столбцы (хотя мне нужно сделать смесь суммы / среднего для разныхпеременные)
Я просто пробую этот метод.Когда я хочу сгруппировать данные по сайту - что должно дать мне 45 строк данных, я получаю ошибку:
Ошибка в UseMethod ("group_by_"): нет применимого метода для group_by_, примененного кобъект класса "персонаж"
он говорит, что я использую "group_by_", когда я на самом деле использую "group_by"
Есть ли простое решение?и есть ли возможность суммировать все столбцы и добавлять или усреднять столбцы в зависимости от переменной (я бы «суммировал» количество проростков и получил бы среднее значение данных по микроклимату)
впервые обращаясь за помощьюонлайн, так что надеюсь, это имеет смысл :))