добавить geom_rect () к данным временного ряда в ggplot2 - PullRequest
1 голос
/ 07 ноября 2019

У меня есть гистограмма, которая использует данные временного ряда для оси x, где каждый столбец представляет 7 дней.

Вот первые несколько строк кадра данных:

# A tibble: 40 x 5
# Groups:   group [26]
   group    thing minDate    count dateRange      
   <drtn>   <dbl> <date>     <dbl> <chr>          
 1  1 days 0      2019-04-02    39 Apr 02 - Apr 08
 2  2 days 0      2019-04-09    39 Apr 09 - Apr 15
 3  3 days 0      2019-04-16    39 Apr 16 - Apr 22
 4  4 days 0      2019-04-23    39 Apr 23 - Apr 29
 5  5 days 0      2019-04-30    39 Apr 30 - May 06

Я пытаюсь выяснить, как добавить полупрозрачный прямоугольник от ymin до ymax для временипериоды, когда count == 0. Я пытаюсь выяснить, как обеспечить значения xmin и xmax для geom_rect(). Кто-нибудь знает, как мне это сделать?

Полные данные от dput():

    test <- 
structure(list(group = structure(c(1, 2, 3, 4, 5, 6, 7, 8, 9, 
                                   10, 11, 12, 13, 13, 14, 14, 15, 15, 16, 16, 17, 17, 18, 18, 19, 
                                   19, 20, 20, 21, 21, 22, 22, 23, 23, 24, 24, 25, 25, 26, 26), class = "difftime", units = "days"), 
               thing = c(0, 0, 0, 0, 0, 0.0476190476190476, 0.325396825396825, 
                         0.388888888888889, 0.214285714285714, 0.103174603174603, 
                         0.158730158730159, 0.0555555555555556, 0, 0, 0.0512820512820513, 
                         0, 0.0769230769230769, 0, 0.205128205128205, 0, 0.102564102564103, 
                         0, 0.58974358974359, 0, 0.615384615384615, 0, 0.358974358974359, 
                         0, 0.0769230769230769, 0, 0.41025641025641, 0, 0.256410256410256, 
                         0, 0.230769230769231, 0, 0, 0, 0.130904183535762, 0), minDate = structure(c(17988, 
                                                                                                     17995, 18002, 18009, 18016, 18023, 18030, 18037, 18044, 18051, 
                                                                                                     18058, 18065, 18072, 18072, 18079, 18079, 18086, 18086, 18093, 
                                                                                                     18093, 18100, 18100, 18107, 18107, 18114, 18114, 18121, 18121, 
                                                                                                     18128, 18128, 18135, 18135, 18142, 18142, 18149, 18149, 18156, 
                                                                                                     18156, 18163, 18163), class = "Date"), count = c(39, 39, 
                                                                                                                                                      39, 39, 39, 39, 51, 27, 39, 39, 39, 39, 9, 39, 108, 0, 78, 
                                                                                                                                                      0, 78, 0, 39, 0, 117, 0, 78, 0, 78, 0, 39, 0, 117, 0, 78, 
                                                                                                                                                      0, 78, 0, 78, 0, 78, 0), dateRange = c("Apr 02 - Apr 08", 
                                                                                                                                                                                             "Apr 09 - Apr 15", "Apr 16 - Apr 22", "Apr 23 - Apr 29", 
                                                                                                                                                                                             "Apr 30 - May 06", "May 07 - May 13", "May 14 - May 20", 
                                                                                                                                                                                             "May 21 - May 27", "May 28 - Jun 03", "Jun 04 - Jun 10", 
                                                                                                                                                                                             "Jun 11 - Jun 17", "Jun 18 - Jun 24", "Jun 25 - Jul 01", 
                                                                                                                                                                                             "Jun 25 - Jul 01", "Jul 02 - Jul 08", "Jul 02 - Jul 08", 
                                                                                                                                                                                             "Jul 09 - Jul 15", "Jul 09 - Jul 15", "Jul 16 - Jul 22", 
                                                                                                                                                                                             "Jul 16 - Jul 22", "Jul 23 - Jul 29", "Jul 23 - Jul 29", 
                                                                                                                                                                                             "Jul 30 - Aug 05", "Jul 30 - Aug 05", "Aug 06 - Aug 12", 
                                                                                                                                                                                             "Aug 06 - Aug 12", "Aug 13 - Aug 19", "Aug 13 - Aug 19", 
                                                                                                                                                                                             "Aug 20 - Aug 26", "Aug 20 - Aug 26", "Aug 27 - Sep 02", 
                                                                                                                                                                                             "Aug 27 - Sep 02", "Sep 03 - Sep 09", "Sep 03 - Sep 09", 
                                                                                                                                                                                             "Sep 10 - Sep 16", "Sep 10 - Sep 16", "Sep 17 - Sep 23", 
                                                                                                                                                                                             "Sep 17 - Sep 23", "Sep 24 - Sep 30", "Sep 24 - Sep 30")), row.names = c(NA, 
                                                                                                                                                                                                                                                                      -40L), class = c("grouped_df", "tbl_df", "tbl", "data.frame"), groups = structure(list(
                                                                                                                                                                                                                                                                        group = structure(c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 
                                                                                                                                                                                                                                                                                            13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26), class = "difftime", units = "days"), 
                                                                                                                                                                                                                                                                        .rows = list(1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 
                                                                                                                                                                                                                                                                                     12L, 13:14, 15:16, 17:18, 19:20, 21:22, 23:24, 25:26, 
                                                                                                                                                                                                                                                                                     27:28, 29:30, 31:32, 33:34, 35:36, 37:38, 39:40)), row.names = c(NA, 
                                                                                                                                                                                                                                                                                                                                                      -26L), class = c("tbl_df", "tbl", "data.frame"), .drop = TRUE))  

рабочий график:

library(ggplot2); library(magrittr)

test %>%
  ggplot(aes(x = minDate, 
             y = thing)) +
  geom_bar(stat = "identity") +
  scale_x_date(breaks = seq(min(test$minDate), 
                            max(test$minDate), 
                            by = paste0(7, " days")), 
               date_labels = unique(test$dateRange)) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1, size = 10))

bars

Ответы [ 3 ]

2 голосов
/ 07 ноября 2019

Следующее, кажется, дает примерно то, что я считаю вашей целью. Обратите внимание, что geom_tile() очень похож на geom_rect(), но параметризован по x / y / width / height вместо xmin / xmax / ymin / ymax. Следовательно, мы можем сделать серию плиток для каждого count == 0.

ggplot(test, aes(x = minDate, 
                 y = thing)) +
  geom_tile(data = test[test$count == 0, ],
            aes(x = minDate, 
                y = 0.5 * max(test$thing), 
                # A width of 7 days
                width = 7, 
                height = max(test$thing)), 
            alpha = 0.2) +
  geom_bar(stat = "identity") +
  scale_x_date(breaks = seq(min(test$minDate), 
                            max(test$minDate), 
                            by = paste0(7, " days")), 
               date_labels = unique(test$dateRange)) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1, size = 10))

enter image description here

1 голос
/ 07 ноября 2019

Должны ли эти недели состоять из двух строк? Если это так, я бы агрегировал с dplyr::summarize().

library(magrittr); library(ggplot2)
breaks_x <- seq(min(test$minDate), max(test$minDate), by = paste0(7, " days"))
palette_translucent <- c("TRUE" = "#77777744", "FALSE"="#777777")

ds <- 
  test %>% 
  dplyr::mutate(
    translucent = (abs(count)  < .0000001)
  ) %>% 
  dplyr::group_by(minDate) %>% 
  dplyr::summarize(
    translucent = any(translucent),
    y = max(thing)
  ) %>% 
  dplyr::ungroup()

labels_x  <- unique(test$dateRange)
ds %>%
  ggplot(aes(x = minDate, y = y, fill = translucent)) +
  geom_bar(stat = "identity") +
  scale_x_date(breaks = breaks_x, date_labels = labels_x) +
  scale_fill_manual(values = palette_translucent) + 
  theme(axis.text.x = element_text(angle = 90, hjust = 1, size = 10)) +
  labs(fill="Count is Zero")

translucent

Я интерпретировал это иначе, чем @teunbrand ( т.е. , один прямоугольник за период времени) & @wusel ( т.е. , ymax для периода времени, а не для выборки). Если мы все неправильно понимаем, опишите, пожалуйста, как.

edit : Если вам нужен подход @ wusel, расчет максимального значения можно пропустить, и вместо него используйте Inf, что является ярлыком ggplotдля «перейти к вершине видимой шкалы».

breaks_x <- seq(min(test$minDate), max(test$minDate), by = paste0(7, " days"))
labels_x  <- unique(test$dateRange)
palette_translucent <- c("TRUE" = "#77777744", "FALSE"="#777777")
ds <- 
  test %>% 
  dplyr::mutate(
    translucent = (abs(count)  < .0000001),
    y     = dplyr::if_else(translucent, Inf, thing) # Inf is ggplot's shortcut for "top of the visible scale"
  ) %>% 
  dplyr::ungroup()

ds %>%
  ggplot(aes(x = minDate, y = y, fill = translucent)) +
  geom_bar(aes(y=y), stat = "identity", position=position_identity()) +
  geom_bar(aes(y=thing), stat = "identity") +
  scale_x_date(breaks = breaks_x, date_labels = labels_x) +
  scale_fill_manual(values = palette_translucent) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1, size = 10)) +
  theme(legend.position = "none")

both bars

1 голос
/ 07 ноября 2019

Я не совсем уверен, как должен выглядеть желаемый результат, но для этого нужно только несколько настроек:

library(lubridate)
library(dplyr)

recs <- test %>% 
  filter(count == 0) %>% 
  mutate(xmin = minDate - days(3),
         xmax = minDate + days(3))

test %>%
  ggplot(aes(x = minDate, 
             y = thing)) +
  # rectangles are behind the bars
  geom_rect(data = recs, 
            # some fixed height of the rectangles
            aes(xmin = xmin, xmax = xmax, ymin = 0, ymax = .7),
            fill = "red", color = "white", alpha = 0.2) +
  geom_bar(stat = "identity") +
  scale_x_date(breaks = seq(min(test$minDate), 
                            max(test$minDate), 
                            by = paste0(7, " days")), 
               date_labels = unique(test$dateRange)) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1, size = 10))

translucent-rectangles

...