Попытка сгруппировать данные по регионам и суммировать по дате в R Studio об эпидемии COVID19 - PullRequest
0 голосов
/ 24 февраля 2020

Я старый программист FOTRAN, C, пытающийся выучить R. Я начал работать с данными об эпидемии COVID19 c и сел на мель.

Данные, с которыми я работаю, начинались как широкие данные, и я преобразовал их в данные строк. Он содержит ежедневное количество случаев по провинциям, регионам / странам, широте, длине, дате, случаям.

Я хочу отфильтровать кадр данных для материкового Китая и суммировать случаи по дате в качестве первого шага. Приведенный ниже код генерирует набор данных NULL, когда я пытаюсь сгруппировать данные.

Спасибо за любую помощь!

library(dplyr)
library(dygraphs)
library(lubridate)
library(tidyverse) 
library(timeSeries)

# Set current working directory.
#
     setwd("/Users/markmcleod/MarksRepository/Data")

# Read a  Case csv files
#
     Covid19ConfirmedWideData <- read.csv("Covid19Deaths.csv",header=TRUE,check.names = FALSE)

# count the number of days of data
#
    Covid19ConfirmedDays = NCOL(Covid19ConfirmedWideData)

# Gather Wide Data columns starting at column 5 until NCOL() into RowData DataFrame
#
    Covid19ConfirmedRowData <- gather(Covid19ConfirmedWideData, Date, Cases, 5:Covid19ConfirmedDays, na.rm = FALSE, convert = TRUE)

    tibble(Covid19ConfirmedRowData)

    # # A tibble: 2,204 x 1
    # Covid19ConfirmedRowData$ProvinceState $CountryRegion  $Lat $Long $Date   $Cases
    # <fct>                                 <fct>          <dbl> <dbl> <chr>    <int>
    #   1 Anhui                                 Mainland China  31.8  117. 1/22/20      0
    # 2 Beijing                               Mainland China  40.2  116. 1/22/20      0
    # 3 Chongqing                             Mainland China  30.1  108. 1/22/20      0

# Transmute date from chr to date
#
   Covid19ConfirmedFormatedData <- transmute(Covid19ConfirmedRowData,CountryRegion,Date=as.Date(Date,format="%m/%d/%Y"),Cases) 

   tibble(Covid19ConfirmedFormatedData)

   # # A tibble: 2,204 x 1
   # Covid19ConfirmedFormatedData$CountryRegion $Date      $Cases
   # <fct>                                      <date>      <int>
   #   1 Mainland China                             0020-01-22      0
   # 2 Mainland China                             0020-01-22      0


Covid19ConfirmedGroupedData  <- Covid19ConfirmedFormatedData %>%
  filter(Covid19ConfirmedFormatedData$CountryRegion=='Mainland China')

  tibble(Covid19ConfirmedGroupedData)

  # A tibble: 2,204 x 1
  Covid19ConfirmedGroupedData[,1]  [,2]  [,3]
  <dbl> <dbl> <dbl>
    1                              NA    NA    NA

1 Ответ

0 голосов
/ 25 февраля 2020

Похоже, у меня конфликт в библиотеках, которые я использую.

Я вернулся к предыдущей версии кода и использовал только следующие библиотеки.

библиотека (dygraphs) библиотека (lubridate) библиотека (tidyverse)

Код кажется опять работа.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...