Работа с пропущенными значениями месяца в наборе данных и построение временного ряда - PullRequest
0 голосов
/ 22 апреля 2019

Итак, у меня есть набор данных в R:

Date            Mean_Value

2003-10-01      7.94
2004-02-01      3.17
2004-03-01      4.62
2004-04-01      5.38
2004-05-01      4.17
2004-06-01      6.40
2004-07-01      4.12
2004-08-01      3.09
2005-01-01      5.32
.
.

и я планирую построить временной ряд для вышеуказанного набора данных, но меня беспокоит одна вещь: правильно ли это сделать, просто построить временной ряд, даже если есть несколько месяцев года в наборе данных выше пропущено? например, в году 2003 пропущенные месяцы "ноябрь" и «Декабрь» , а в году 2004 пропущены месяцы «Сентябрь, октябрь, ноябрь и декабрь» .

Список по годам продолжается до 2012 года, и действительно есть несколько лет со всеми присутствующими месяцами . Хотя некоторые годы пропускают определенные месяцы, как в примере выше, смогу ли я построить временной ряд, игнорируя тот факт, что существует пропущенных месяцев в некоторые годы?

1 Ответ

0 голосов
/ 22 апреля 2019

Мы можем преобразовать в xts, а затем сделать plot

library(xts)
xt1 <- xts(df1$Mean_Value, order.by = as.Date(df1$Date))
plot(xt1)

Или используйте complete для создания недостающей даты, а затем с ggplot plot

library(tidyverse)
library(ggplot2)
df1 %>%
   complete(Date = seq(first(Date), last(Date), by = "1 month"), 
         fill = list(Mean_Value = 0)) %>% 
   ggplot(., aes(x = Date, y = Mean_Value)) + 
           geom_line()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...