Чтобы рассчитать количество выигранных матчей на основе броска, вы можете сделать:
library(dplyr)
library(ggplot2)
matches %>%
mutate(toss_match = ifelse(toss_winner == winner, "Won", "Loss")) %>%
count(toss_match) %>%
ggplot() + aes(toss_match, n, fill = toss_match) +
geom_col() +
xlab("Toss")+ ylab("Number of matches won")+
ggtitle("How much of advantage is winning the toss ?")
Вы можете go далее и сделать тот же анализ для лучших городов, где были сыграны матчи.
matches %>%
mutate(toss_match = ifelse(toss_winner == winner, "Won", "Loss")) %>%
count(city, toss_match) %>%
group_by(city) %>%
filter(all(n > 10)) %>%
mutate(n = n/sum(n) * 100) %>%
ggplot() + aes(city, n, fill = toss_match) +
geom_col() +
xlab("City")+ ylab("Percentage") +
ggtitle("Advantage of winning toss in each city")