Я делаю анализ данных в английской премьер-лиге
мои данные выглядят так введите описание изображения здесь
Я разделил счет как домашний счет и счет гостей для дальнейшего анализа и написал этот код, чтобы увидеть общее количество голов для обеих сторон, прежде чем брать среднее значение для дома, в гостях и общее количество голов
- это для разделения ---
dat.df <-separate (dat, col = score, into = c ("home", "away"), sep = ":") </p>
Затем я заменил Na w 0, чтобы не получить нечисловую ошибку
x1<-dat.df %>% mutate_at(c(4:6), ~replace(., is.na(.), 0))
Затем я попробовал несколько способов получить сумму, затем среднюю, как показано ниже
x1 %>% group_by(home>away) %>% sum(x1$home)
x1 %>% group_by(home>away) %>% sum(x1$home,x1$away)
x1 %>% group_by(home>away) %>% summarise(Total = sum(home,away))
mean(x1[x1$type == "soccer", "away"])
Все они выдавали одну и ту же ошибку: « определен только для фрейма данных со всеми числовыми переменными »
Я не могу найти ответ в других блогах здесь, поэтому я решил спросить, каждая помощь приветствуется. Спасибо