Я хотел бы узнать, как рассчитать процент столбца на основе условия.
Моя таблица выглядит следующим образом:
url | call_count
-------|-----------
bbc.com| 1
bbc.com| 1
bbc.com| 1
bbc.com| 1
ao.com | 0
ab.com | 2
Я хотел бы сгруппировать таблицу по url column
и вычислить новый столбец с именем "percent_calling"
- это основано на условии, согласно которому значение столбца call_count больше 0 , затем рассчитайте его как процент от значения всего столбца - это в основном просто% вызова, если значение> 0, так как> 0 означает, что они сделали вызов.
В настоящее время я застрял в том, как сделать это с помощью dplyr, самое близкое, что у меня есть, это:
df %>%
group_by(url) %>%
summarise(percent_calling = sum(call_count)/nrow(df))
, но, как вы можете видеть, я не могу добавить условие, т.е. call_count> 0