использование набора данных и выбор переменных - PullRequest
0 голосов
/ 03 мая 2020

Я загрузил набор данных. но как мне показать тех, кто умер в Европе.

df <- read.csv ('https://raw.githubusercontent.com/ulklc/covid19-timeseries/master/countryReport/raw/rawReport.csv')

europe <-- df[df$region =="Europe"]

df$death [europe]

Ответы [ 2 ]

0 голосов
/ 03 мая 2020

Мы также можем использовать subset в aggregate

aggregate(death~countryName, df, subset = region =="Europe"), sum)

или используя rowsum

with(subset(df, region == 'Europe'), rowsum(death, countryName))
0 голосов
/ 03 мая 2020

Мы можем отфильтровать только европейские страны и рассчитать количество смертей по странам.

Это можно сделать в базе R:

df1 <- aggregate(death~countryName, subset(df, region =="Europe"), sum)

dplyr

library(dplyr)
df1 <- df %>% 
        filter(region == 'Europe') %>% 
        group_by(countryName) %>% 
        summarise(total_death = sum(death))

и в data.table

df1 <- setDT(df)[region == 'Europe', (total_death = sum(death)), countryName]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...