Я не уверен, возможно ли это.Я хочу использовать суммирование для подсчета всех строк, которые имеют NA во всех столбцах, кроме group_by.Я могу сделать это, соединив все 5 условий, где у меня есть NO_OL_Percent =
, затем я должен соединить каждый столбец с &
.Если вы можете сделать это в SQL, я думаю, вы могли бы сделать это с помощью dplyr или purrr, но, похоже, никто в Интернете не пробовал этого.
Данные должны быть загружены здесь
Код ниже.Это работает, но неужели нет способа использовать функцию all для последней строки кода?Мне нужно сначала сделать group_by, и я не могу использовать filter_all в dplyr.
farmers_market = read.csv("Export.csv", stringsAsFactors = F, na.strings=c("NA","NaN", ""))
farmers_market %>%
select(c("Website", "Facebook", "Twitter", "Youtube", "OtherMedia", "State")) %>%
group_by(State) %>%
summarise(Num_Markets = n(),
FB_Percent = 100 - 100*sum(is.na(Facebook))/n(),
TW_Percent = 100 - 100*sum(is.na(Twitter))/n(),
#fb=sum(is.na(Facebook)),
OL_Percent = 100 - 100*sum(is.na(Facebook) & is.na(Twitter))/n(),
NO_OL_Percent = 100 - 100*sum(is.na(Facebook) & is.na(Twitter) & is.na(Website) & is.na(Youtube) & is.na(OtherMedia))/n()
)