Как отобразить цветные групповые корреляции с scale_colour_manual в ggpairs (R)? - PullRequest
1 голос
/ 12 апреля 2019

Я использую ggpairs для данных с 3 группами.Проблема состоит в том, что не все переменные имеют все группы, и поэтому для некоторых корреляций нужно только показать 2 группы.Из-за автоматического алфавитного упорядочения групп по ggpairs раскраска не согласована.Первый цвет всегда присваивается первому уровню фактора.(Например: группа 1 = красный, группа 2 = синий, группа 3 = зеленый. Но с переменными, имеющими только вторую и последнюю группу: группа 2 = красная и группа 3 = синий.)

Я пыталсяРешите эту проблему самостоятельно, добавив scale_colour_manual следующим образом:

scale_colour_manual(values = c("group1"="#F8766D", "group2"="#00BA38", "group3"="#619CFF"))

Это работает для графиков плотности на диагонали (ggally_densityDiag) и для диаграмм рассеяния в нижней части (ggally_points), нодля корреляций (ggally_cor) я получаю только общие (черные) корреляции и больше нет цветных групповых корреляций.Хотя они отображались раньше, но с неправильным соответствием цветов и групп.Почему они больше не отображаются?

Следующий код генерирует это plot, цвета и группы не совпадают.

ggpairs(output.b[,c(13,17,18)], aes(colour = as.factor(output.b$country), alpha = 0.4),
upper = list(continuous = function(data, mapping, ...) {
  ggally_cor(data = output.b, mapping = mapping) + scale_colour_manual(values = c("#F8766D", "#00BA38", "#619CFF"))}),
lower = list(continuous = function(data, mapping, ...) {
  ggally_points(data = output.b, mapping = mapping) + scale_colour_manual(values = c("#F8766D", "#00BA38", "#619CFF"))}),
diag = list(continuous = function(data, mapping, ...) {
  ggally_densityDiag(data = output.b, mapping = mapping) + scale_fill_manual(values = c("#F8766D", "#00BA38", "#619CFF"))}))

Адаптированный код сгенерировал эту plot, цветную группукорреляции больше не отображаются.

ggpairs(output.b[,c(13,17,18)], aes(colour = as.factor(output.b$country), alpha = 0.4),
upper = list(continuous = function(data, mapping, ...) {
  ggally_cor(data = output.b, mapping = mapping) + scale_colour_manual(values = c("group1"="#F8766D", "group2"="#00BA38", "group3"="#619CFF"))}),
lower = list(continuous = function(data, mapping, ...) {
  ggally_points(data = output.b, mapping = mapping) + scale_colour_manual(values = c("group1"="#F8766D", "group2"="#00BA38", "group3"="#619CFF"))}),
diag = list(continuous = function(data, mapping, ...) {
  ggally_densityDiag(data = output.b, mapping = mapping) + scale_fill_manual(values = c("group1"="#F8766D", "group2"="#00BA38", "group3"="#619CFF"))}))

1 Ответ

0 голосов
/ 13 апреля 2019

[ОБНОВЛЕНО] После долгих поисков и попыток я обнаружил проблему, но не смог ее решить. Чтобы изменить цвет 'group3:' в верхних корреляциях на синий, я должен изолировать эти графики и сделать scale_colour_manual, как в следующем коде:

p <- ggpairs(...)
p[1,2] <- p[1,2] + scale_colour_manual("group3: 0.113" = "#F8766D")
p[1,3] <- p[1,3] + scale_colour_manual("group3: 0.268" = "#F8766D")

Слишком громоздко делать все это вручную, поскольку мне приходится создавать несколько таких графиков с разными группировками, и у меня есть еще много переменных ... Есть ли способ автоматически реализовать это в ggally_cor?

...