Для цикла для создания списка ggplots всегда сохраняйте одинаковые координаты для точек и сегментов - PullRequest
0 голосов
/ 31 января 2019

сначала вам нужно загрузить эти пакеты:

library(ggplot2)
library(ggrepel)

У меня есть фрейм данных "dframe", подобный этому:

V1          V2           V3          V4          V5          V6          V7          Groups
0.05579838 -0.44781204 -0.164612982 -0.05362210 -0.23103516 -0.04923499 -0.06634579      1
0.14097924 -0.35582736  0.385218841  0.18004788 -0.18429327  0.29398646  0.69460669      2
0.10699838 -0.38486299 -0.107284020  0.16468591  0.48678593 -0.70776085  0.20721932      3
0.22720072 -0.30860464 -0.197930310 -0.24322096 -0.30969028 -0.04460600 -0.08420536      4
0.24872635 -0.23415141  0.410406163  0.07072146 -0.09302970  0.01662256 -0.21683816      5
0.24023670 -0.27807097 -0.096301697 -0.02373198  0.28474825  0.27397862 -0.29397324      6
0.30358363  0.05630646 -0.115190308 -0.51532428 -0.08516130 -0.08785924  0.12178198      7
0.28680386  0.07609196  0.488432908 -0.13082951  0.00439161 -0.17572986 -0.25854047      8
0.30084361  0.06323714 -0.008347161 -0.26762137  0.40739524  0.22959024  0.19107494      9
0.27955675  0.22533959 -0.095640072 -0.27988676 -0.04921808 -0.10662521  0.19934074     10
0.25209125  0.22723231  0.408770841  0.13013867 -0.03850484 -0.23924023 -0.16744745     11
0.29377963  0.13650247 -0.105720288 -0.00316556  0.29653723  0.25568169  0.06087608     12
0.24561895  0.28729625 -0.167402464  0.24251060 -0.22199262 -0.17182828  0.16363196     13
0.25150342  0.25298115 -0.147945172  0.43827820  0.02938933  0.01778563  0.15241257     14
0.30902922 -0.01299330 -0.261085058  0.13509982 -0.40967529 -0.11366113 -0.06020937     15
0.28696274 -0.12896680 -0.196764195  0.39259942  0.08362863  0.25464125 -0.29386260     16

Вот воспроизводимый фрейм данных, который вы можете использовать из MarkПетерсон:

dframe <-
  rnorm(70) %>%
  matrix(nrow = 10) %>%
  as_tibble() %>%
  setNames(paste0("V", 1:ncol(.))) %>%
  mutate(Groups = 1:nrow(.)
         , Label = 1:nrow(.))

Я создал таблицу комбинаций столбцов, которую я хочу использовать из моего фрейма данных:

#Create all possible combinations
combs<-expand.grid(seq(7),seq(7))
#Remove duplicate and order
combs<-combs[combs$Var1 != combs$Var2,]
combs<-combs[order(combs[,1]),]

, затем я создал цикл for, который должен генерировать список ggplots, 1 график по комбинации:

list_EVplots<-list()
  for(i in seq(nrow(combs))){
    list_EVplots[[paste(combs[i,1],"&",combs[i,2])]]<- ggplot(data=dframe) +
      ggtitle(paste("Eigenvector Plot - Pairwise",
                    "correlation with","adjustment")) +
      geom_point(aes(x = dframe[,combs[i,1]], y = dframe[,combs[i,2]],
                     color = Groups)) +
      geom_segment(aes(x = rep(0,nrow(dframe)), y = rep(0,nrow(dframe)),
                       xend = dframe[,combs[i,1]], yend = dframe[,combs[i,2]],
                       color = Groups),
                   size = 1, arrow = arrow(length = unit(0.3,"cm"))) +
      geom_label_repel(aes(x = dframe[,combs[i,1]], y = dframe[,combs[i,2]],
                           label = rownames(dframe))) +
      scale_color_manual(values=colors) +
      xlab(paste0("Eigenvector ",combs[i,1])) +
      ylab(paste0("Eigenvector ",combs[i,2])) +
      theme(plot.title = element_text(hjust = 0.5),
            axis.title = element_text(size = 13),
            legend.text = element_text(size=12)) +
      geom_hline(yintercept = 0, linetype="dashed") +
      geom_vline(xintercept = 0, linetype="dashed")
  }

После запуска цикла for я получаю свой список "list_EVplots".Проблема: кажется, что итерации работают для xlab () и ylab (), они также работают для имен графиков в списке, но координаты geom_point (aes ()) и geom_segment (aes ()) не меняются.Координаты остаются неизменными, когда они, очевидно, должны измениться!Я думаю, что координаты остаются заблокированными на той, которая использовалась для первого графика первой итерации.Если у кого-то есть решение для этого, я был бы очень признателен за вашу помощь.

Работа под Linux 16.04 с R Studio.Версия R 3.5.2 (2018-12-20) - «Eggshell Igloo»

Я пытался использовать поднастроенный фрейм данных только с теми столбцами, с которыми хотел работать, вместо использования фрейма с 8 столбцами: неработа.

Ожидаемый: список должен содержать разные графики: все графики должны быть разными.

Проблема: все графики имеют одинаковые координаты для точек и сегментов в списке.

1 Ответ

0 голосов
/ 31 января 2019

Самый простой ответ часто самый простой: старайтесь избегать использования циклов for в местах, где lapply более уместно.Я не вижу в вашем коде ничего очевидного, что подсказывает, в чем заключается проблема, но я предполагаю, что это проблема глубоко вложенных операторов [].

Вот подход, использующий lapply иaes_string для обработки переменных.Если вам нужно что-то кроме полного попарного набора графиков, вам, возможно, придется изменить вызовы на два бита lapply.

Во-первых, некоторые воспроизводимые данные (сделанные с использованием dplyr).Обратите внимание, что я сделал Labels явным вместо того, чтобы полагаться на имена строк (это хорошая практика, и ее гораздо проще использовать при вызовах ggplot).

dframe <-
  rnorm(70) %>%
  matrix(nrow = 10) %>%
  as_tibble() %>%
  setNames(paste0("V", 1:ncol(.))) %>%
  mutate(Groups = 1:nrow(.)
         , Label = 1:nrow(.))

Затем я вытаскиваюстолбцы, которые вы хотите использовать для своих графиков.Я называю их так, чтобы возвращаемому списку автоматически присваивались имена столбцов.

my_cols <-
  names(dframe)[1:7] %>%
  setNames(.,.)

Затем просто установите вложенный lapply для обработки всех парных сравнений:

plot_list <-
  lapply(my_cols, function(col1){
    lapply(my_cols, function(col2){

      if(col1 == col2){
        return(NULL)
      }

      ggplot(dframe) +
        ggtitle(paste("Eigenvector Plot - Pairwise",
                      "correlation with","adjustment")) +
        geom_point(aes_string(x = col1
                              , y = col2
                              , color = "Groups")) +
        geom_segment(aes_string(xend = col1
                                , yend = col2
                                , color = "Groups")
                     , x = 0
                     , y = 0
                     , size = 1
                     , arrow = arrow(length = unit(0.3,"cm"))) +
        geom_label_repel(aes_string(x = col1
                                    , y = col2
                                    , label = "Label")) +
        xlab(paste0("Eigenvector ", col1)) +
        ylab(paste0("Eigenvector ", col2)) +
        theme(plot.title = element_text(hjust = 0.5),
              axis.title = element_text(size = 13),
              legend.text = element_text(size=12)) +
        geom_hline(yintercept = 0, linetype="dashed") +
        geom_vline(xintercept = 0, linetype="dashed")

    })
  })

Обратите внимание, что вы не включили цвета, которые вы хотели использовать для групп, поэтому я оставил значения по умолчанию вместо этого.

Графики получаются правильно, и с ними легче работать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...