Построение данных временных рядов в R по годам - PullRequest
0 голосов
/ 05 августа 2020

У меня есть серия наблюдений, проводимых с интервалом почти в месяц, и я хочу построить их. В некоторые месяцы может быть более одного наблюдения, поэтому день важен. (т.е. одна строка для 2018 года, другая для 2019, еще одна для 2020).

Я хочу, чтобы моя ось X работала с 1 января по 31 декабря.

Данные

      Date      Value
2018-04-30         NA
2018-05-31        102
2018-06-29         27
2018-07-01          3
2018-07-31         27
2018-09-04         52
2018-09-05          1
2018-10-01         78
2018-10-31        117
2018-11-30        245
2019-01-02        201
2019-01-31        256
2019-02-28        228
2019-04-01        155
2019-05-01        111
2019-05-31        105
2019-07-01         77
2019-07-31         61
2019-08-30         79
2019-10-01         76
2019-10-31        104
2019-12-03        196
2020-01-02        162
2020-01-31        292
2020-02-28        266
2020-03-26        145
2020-05-01        130
2020-06-03         86
2020-07-01         42

Это то, что я пробовал до сих пор, и у меня есть доступ к пакетам «ggplot2», «dplyr», «zoo» и «lubridate»

ggplot(a, aes(x = Date, y = Value)) +
  geom_point() +
  geom_line() +
  scale_x_date(date_minor_breaks = "1 month", date_labels = "%B %Y") +
  theme_bw()

введите описание изображения здесь

1 Ответ

1 голос
/ 05 августа 2020

Может, это поможет. Вы должны сначала отформатировать дату по годам, чтобы сделать группы и цвета. Вы можете обмануть ось, добавив общий год, например 2020. Вот возможное решение:

library(tidyverse)
#Data
df <- structure(list(Date = c("2018-04-30", "2018-05-31", "2018-06-29", 
"2018-07-01", "2018-07-31", "2018-09-04", "2018-09-05", "2018-10-01", 
"2018-10-31", "2018-11-30", "2019-01-02", "2019-01-31", "2019-02-28", 
"2019-04-01", "2019-05-01", "2019-05-31", "2019-07-01", "2019-07-31", 
"2019-08-30", "2019-10-01", "2019-10-31", "2019-12-03", "2020-01-02", 
"2020-01-31", "2020-02-28", "2020-03-26", "2020-05-01", "2020-06-03", 
"2020-07-01"), Value = c(NA, 102L, 27L, 3L, 27L, 52L, 1L, 78L, 
117L, 245L, 201L, 256L, 228L, 155L, 111L, 105L, 77L, 61L, 79L, 
76L, 104L, 196L, 162L, 292L, 266L, 145L, 130L, 86L, 42L)), row.names = c(NA, 
-29L), class = "data.frame")

Следующий код:

#Format dates
df$Date <- as.Date(df$Date)
#Create year
df$Year <- format(df$Date,'%Y')
#Create day and month of year
df$Day <- format(df$Date,'%d')
df$Month <- format(df$Date,'%m')
#Assign a dummy date
df$DayMonth <- as.Date(paste0(2020,'-',df$Month,'-',df$Day))
#Now sketch for plot
ggplot(df, aes(x = DayMonth, y = Value,group=Year,color=Year)) +
  geom_point() +
  geom_line() +
  scale_x_date(date_minor_breaks = "1 month", date_labels = "%B %d")+
  theme_bw()+
  theme(axis.text.x = element_text(angle=90))

введите описание изображения здесь

...