R Полностью волоченый коробчатый участок с шириной NA - PullRequest
0 голосов
/ 26 октября 2018

Я строю сгруппированный блокпост с джиттером с помощью следующей функции:

plot_boxplot <- function(dat) {
  # taking one of each joine_group to be able to plot it
  allx <- dat %>% 
    mutate(y = median(y, na.rm = TRUE)) %>%
    group_by(joined_group) %>% 
    sample_n(1) %>% 
    ungroup()

  p <- dat %>%
    plotly::plot_ly() %>%
    # plotting all the groups 1:20
    plotly::add_trace(data = allx, 
                      x = ~as.numeric(joined_group),
                      y = ~y,
                      type = "box",
                      hoverinfo = "none",
                      boxpoints = FALSE,
                      color = NULL,
                      opacity = 0,
                      showlegend = FALSE) %>% 
    # plotting the boxes
    plotly::add_trace(data = dat, 
                      x = ~as.numeric(joined_group),
                      y = ~y,
                      color = ~group1,
                      type = "box",
                      hoverinfo = "none",
                      boxpoints = FALSE,
                      showlegend = FALSE) %>% 
    # adding ticktext
    layout(xaxis = list(tickvals = 1:20,
                        ticktext = rep(levels(dat$group1), each = 4)))

  p <- p %>%
    # adding jittering
    add_markers(data = dat,
                x = ~jitter(as.numeric(joined_group), amount = 0.2),
                y = ~y,
                color = ~group1,
                showlegend = FALSE)
  p

}

Проблема в том, что когда некоторые уровни имеют переменную NA как y, ширина изменяемых блоков изменяется,Вот пример:

library(plotly)
library(dplyr)
set.seed(123)
dat <- data.frame(group1 = factor(sample(letters[1:5], 100, replace = TRUE)),
                  group2 = factor(sample(LETTERS[21:24], 100, replace = TRUE)),
                  y = runif(100)) %>% 
  dplyr::mutate(joined_group = factor(
    paste0(group1, "-", group2)
  ))

# do the plot with all the levels
p1 <- plot_boxplot(dat)

# now the group1 e is having NAs as y values
dat$y[dat$group1 == "e"] <- NA

# create the plot with missing data
p2 <- plot_boxplot(dat)

# creating the subplot to see that the width has changed:
subplot(p1, p2, nrows = 2)

Проблема в том, что ширина блоков на обоих графиках различна: enter image description here

Я понял, что коробкиимеют одинаковый размер без дрожания, поэтому я знаю, что дрожание "мешает" с шириной, но я не знаю, как это исправить.enter image description here

Кто-нибудь знает, как сделать ширину на обоих волнистых участках одинаковой?

1 Ответ

0 голосов
/ 26 октября 2018

Я вижу две отдельные смены сюжета:

  1. из-за дрожания
  2. из-за NA

Сначала можно решить, объявив новую функцию дрожания с фиксированным начальным числом

fixed_jitter <- function (x, factor = 1, amount = NULL) {
  set.seed(42)
  jitter(x, factor, amount)
}

и использовать его вместо jitter в add_markers вызове.

Вторую проблему можно решить, назначив -1 вместо NA и установив

yaxis = list(range = c(0, ~max(1.1 * y)))

в качестве второго параметра для layout.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...