Группировка данных уровня округа по штатам с помощью R - PullRequest
0 голосов
/ 08 апреля 2020

Я пытаюсь узнать R, используя данные Джона Хопкинса COVID-19, расположенные по адресу:

https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data/csse_covid_19_time_series

Я пытаюсь работать с файл time_series_covid19_confirmed_US.csv. Данные представлены в формате временных рядов с разрешением до уровня округа. Я хотел бы работать с итоговыми данными на уровне штатов за каждый день. Я могу удалить столбцы информации, которая мне не нужна, но я застрял, пытаясь сгруппировать округа в штаты.

Ответы [ 2 ]

1 голос
/ 08 апреля 2020

С data.table: 1 строка для чтения текста, 1 - среднее значение по группе:

library(data.table)
url <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_US.csv"

dt <- fread(url)

dt[, lapply(.SD, sum),
   by  = "Province_State", .SDcols = colnames(dt)[endsWith(suffix = "20", colnames(dt))]]
1 голос
/ 08 апреля 2020

Вот подход с dplyr. Мы можем использовать библиотеку RCurl для простой загрузки данных.

library(RCurl)
library(dplyr)
url <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_US.csv"
raw <- getURL(url)
data <- read.csv(text=raw)
data %>%
   group_by(Province_State) %>%
   summarise_at(vars(ends_with("20")), sum)
## A tibble: 58 x 78
#   Province_State X1.22.20 X1.23.20 X1.24.20 X1.25.20 X1.26.20 X1.27.20 X1.28.20 X1.29.20 X1.30.20 X1.31.20 X2.1.20 X2.2.20 X2.3.20 X2.4.20
#   <fct>             <int>    <int>    <int>    <int>    <int>    <int>    <int>    <int>    <int>    <int>   <int>   <int>   <int>   <int>
# 1 Alabama               0        0        0        0        0        0        0        0        0        0       0       0       0       0
# 2 Alaska                0        0        0        0        0        0        0        0        0        0       0       0       0       0
# 3 American Samoa        0        0        0        0        0        0        0        0        0        0       0       0       0       0
# 4 Arizona               0        0        0        0        1        1        1        1        1        1       1       1       1       1
# 5 Arkansas              0        0        0        0        0        0        0        0        0        0       0       0       0       0
# 6 California            0        0        0        0        2        2        2        2        2        3       3       3       6       6
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...