Нахождение наибольшей суммы двух столбцов в наборе данных - PullRequest
0 голосов
/ 08 октября 2019

У меня есть следующие 3 столбца данных, заданных в R:

 Year  Boys  Girls
 2018  5000  4000
 2019  5030  4050
 2020  5040  4010

Как мне найти, в каком году было наибольшее количество мальчиков и девочек (используя R)?

Ничего из того, что я видел после поиска в Интернете, не показывает мне код, который будет показывать год с наибольшей суммой, а также общее количество.

Ответы [ 2 ]

1 голос
/ 08 октября 2019

Чтобы отобразить год и наибольшую сумму, используйте следующий код:

df$Total <- df$Boys + df$Girls
df[which.max(df$Boys + df$Girls), c('Year', 'Total')]

В первой строке добавляется столбец с именем Total с общим количеством мальчиков и девочек, а во второй строкеопределяет, в какой строке находится наибольшее общее количество, и сообщает значение Year и Total из этой строки.

0 голосов
/ 08 октября 2019

И tidyverse способ

## Construct data frame
df <- tibble(Year = 2018:2020, 
Boys=c(5000,5030,5040), 
Girls=c(4000,4050,4010))

df %>% 
mutate(Total = Boys + Girls) %>% # Add totals to the data frame
filter(Total == max(Total))   # Extract row with highest total

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...