Я пытаюсь очистить некоторые данные (https://github.com/CSSEGISandData/COVID-19/blob/master/csse_covid_19_data/csse_covid_19_time_series/time_series_19-covid-Confirmed.csv), касающиеся нового коронавируса COVID19, для проведения различных видов анализа (ie. Создать диаграмму стран со 100 случаями с течением времени, или отслеживать смертность с течением времени в каждой стране). Я использовал данные, у которых даты были столбцами, а страны - строками. Я переместил Dataframe так, чтобы у меня был столбец для каждой страны и один столбец дат, как показано ниже.
Я попытался прочитать это Кадр данных в качестве объекта временного ряда через следующий код:
covid19ts = ts(covid19, frequency = 365, start = c(2020,22))
В результате получается следующее. Вместо того, чтобы получать даты в качестве столбца индекса, я получаю число от 1 до 47 (количество записанных дней). Это приводит к тому, что я не могу создавать диаграммы или проводить какой-либо значимый анализ.
Я также попробовал следующий код, используя пакет lubridate с теми же результатами:
covid19ts = ts(covid19, frequency = 365, start= decimal_date(as.Date("2020-01-22")))
Как я могу сделать мои даты в настоящие даты для составления графиков и анализа?
Или я мог бы использовать совершенно другой подход, который был бы лучше для анализа, который я пытаюсь сделать?
Спасибо за ваша помощь.