Функция «group_by» в dplyr не работает - регистрация в консоли как «group_by_» - PullRequest
1 голос
/ 08 апреля 2019

Я абсолютный новичок в R - перебираю свой путь для получения степени :)

Мне нужно обобщить очень большой набор данных по сайту, так как в настоящее время существует несколько строк на сайт и около 70столбцы переменных - как числовые, так и категориальные.Я смотрю на регенерацию рассады на каждом участке.

У меня 45 учебных площадок, и я пытаюсь суммировать все мои переменные для каждого сайта.в настоящее время - на каждом из исследуемых участков имеется несколько видов растений в диапазоне от 5 до 30 + =>, поэтому я могу иметь до 30 рядов для каждого участка, поскольку каждый новый вид на участке имеет свой собственный ряд с #trees, # saplings #, саженцы, другие переменные в виде столбцов.

я пробовал этот код:

i <- sapply(data.df, is.factor)  ### convert "factor" variables to "character" for dply analysis
data.df[i] <- lapply(data.df[i], as.character)

select(data.df,site,total_seedlings_m2,age,age_category,landuse_history, exotic_landcover_types,native_landcover_types,prcnt_light_transmittance,avg_canopy_height,prcnt_total_herb_cover,annual_rainfall_mm,annual_sunshine_hours,annual_temp_mean,annual_ground_frost_days,annual_rel_humidity,daily_air_rh_range,daily_air_temp_range,daily_soil_temp_range,total_trees_m2,total_basal_area_m2)
group_by_(site)

summarise_all(data.df)  

я хочу суммировать все столбцы (хотя мне нужно сделать смесь суммы / среднего для разныхпеременные)

Я просто пробую этот метод.Когда я хочу сгруппировать данные по сайту - что должно дать мне 45 строк данных, я получаю ошибку:

Ошибка в UseMethod ("group_by_"): нет применимого метода для group_by_, примененного кобъект класса "персонаж"

он говорит, что я использую "group_by_", когда я на самом деле использую "group_by"

Есть ли простое решение?и есть ли возможность суммировать все столбцы и добавлять или усреднять столбцы в зависимости от переменной (я бы «суммировал» количество проростков и получил бы среднее значение данных по микроклимату)

впервые обращаясь за помощьюонлайн, так что надеюсь, это имеет смысл :))

1 Ответ

0 голосов
/ 08 апреля 2019

Попробуйте это должно работать

i <- sapply(data.df, is.factor)  
data.df[i] <- lapply(data.df[i], as.character)

library(dplyr)
data.df%>%group_by(site)%>%summarise(count=n())
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...