агрегирование значений региона в наборе данных - PullRequest
0 голосов
/ 08 мая 2020
 df <- read.csv ('https://raw.githubusercontent.com/ulklc/covid19- 
 timeseries/master/countryReport/raw/rawReport.csv',
            stringsAsFactors = FALSE)

Я обработал набор данных.

Можем ли мы найти день наименьшей смерти в азиатском регионе?

здесь важная вещь; это сумма смертей во всех странах азиатского региона. Соответственно, он должен отсортировать и найти день.

в качестве вывода;

date region death

2020/02/17 asia 6300 (asia region sum)

Данные на выходе I созданы примеры. Данные в примере не соответствуют действительности.

Ответы [ 2 ]

0 голосов
/ 08 мая 2020

Так как это совокупные случаи и смертей, нам нужно разность данные.

library(dplyr)

df %>%
  mutate(day = as.Date(day)) %>%
  filter(region=="Asia") %>%
  group_by(day) %>%
  summarise(deaths=sum(death)) %>%
  mutate(d=c(first(deaths),diff(deaths))) %>%
  arrange(d)

# A tibble: 107 x 3
   day        deaths     d
   <date>      <int> <int>
 1 2020-01-23     18     1 # <- this day saw only 1 death in the whole of Asia
 2 2020-01-29    133     2
 3 2020-02-21   2249     3
 4 2020-02-12   1118     5
 5 2020-01-24     26     8
 6 2020-02-23   2465    10
 7 2020-01-26     56    14
 8 2020-01-25     42    16
 9 2020-01-22     17    17
10 2020-01-27     82    26
# ... with 97 more rows

Таким образом, во второй день записи было зафиксировано наименьшее количество смертей (пока) .

0 голосов
/ 08 мая 2020

Использование пакета dplyr для обработки данных:

df <- read.csv ('https://raw.githubusercontent.com/ulklc/covid19- 
 timeseries/master/countryReport/raw/rawReport.csv',
                stringsAsFactors = FALSE)
library(dplyr)

df_sum <- df %>% group_by(region,day) %>% # grouping by region and day
  summarise(death=sum(death)) %>% # summing following the groups
  filter(region=="Asia",death==min(death)) # keeping only minimum of Asia

Тогда у вас есть:

> df_sum
# A tibble: 1 x 3
# Groups:   region [1]
  region day        death
  <fct>  <fct>      <int>
1 Asia   2020/01/22    17
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...