Как вы находите статистику столбчатой ​​диаграммы в R? - PullRequest
0 голосов
/ 11 апреля 2020

В моем наборе данных есть 2 переменные:

1) Match_City (название города, в котором проводится футбольный матч) 2) Home_score (количество голов домашней команды)

Проблема Есть ли более 1500 городов, и невозможно определить, в каких городах самый высокий показатель Home_score. Я хочу знать, смогу ли я получить данные этой столбчатой ​​диаграммы, т.е. у города А в общей сложности 20 голов от домашней команды. В настоящее время я использую geom_col (), чтобы сделать диаграмму столбца. Мне нужна помощь!

1 Ответ

0 голосов
/ 12 апреля 2020

Немного сложно понять ваш вопрос, и, как уже отмечали другие, вы должны попытаться привести нам воспроизводимый пример с кодом.

Однако, если я правильно понимаю ваш вопрос ...

У вас большой массив данных с двумя столбцами (Match_City и Home_score), и вы создали диаграмму столбцов для сравнения итогов Home_score для каждый Match_City.

Теперь вы можете визуально увидеть, какой Match_City имеет наивысший общий балл Home_score, но вы хотели бы, чтобы R вычислял эти числа так, чтобы вы могли работать с ними. Агрегатная функция - ваш лучший выбор.

Пример кода:

#Let's Create Some Data

df <- data.frame(Match_City=sample(LETTERS[1:5], size = 100, replace = TRUE), Home_score=sample(1:6, size = 100, replace = TRUE))

#Aggregate will find the sum of Home_score for each Match_City

score_summary<-aggregate(Home_score~Match_City, data = df, FUN = sum)

#You can then sort the score_summary data frame so that the Home_score sums are in decreasing order

score_summary<-score_summary[order(score_summary$Home_score, decreasing = TRUE),]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...