ggalluvial: порядок потоков линий на основе переменной в страте - PullRequest
0 голосов
/ 24 октября 2018

Я использую общие данные о диабете, Обработка данных (от непрерывного к дискретному)

library("ggalluvial")
dat$Glucose_cat<- cut(dat$Glucose,breaks=c(1,100,125,max(dat$Glucose)), labels = c("Low","Normal","High"))
dat$BMI_cat <- cut(dat$BMI, breaks= c(17,25,30,35,40,max(dat$Age)), labels = c("18-25", "25-30", "30-35", "35-40", "40+"))
dat$Outcome_cat<-cut(dat$Outcome, breaks = c(-Inf,0,Inf), labels = c("Negative", "Positive"))
dat$freq <- 1`

dat3d <- dat[, .(freq3d = .N, freq = sum(freq)), by=list(Glucose_cat, 
BMI_cat, Outcome_cat)]
dat3d<- dat3d[!(is.na(dat3d$BMI_cat))]
dat3d<- dat3d[!(is.na(dat3d$Glucose_cat))]
setnames(dat3d, old = c('Glucose_cat', 'BMI_cat','Outcome_cat'), new = c('Glucose', 'BMI','Diabetes'))

ggplot(dat3d,aes(axis1= Diabetes, axis2=Glucose, axis3 = BMI, y = freq))+
geom_alluvium(aes(fill=Diabetes), reverse = FALSE)+
scale_fill_manual(labels = c("Negative", "Positive"), values = c("blue", "red"))+
scale_x_discrete(limits = c("Glucose", "BMI"), expand = c(.001, .001))+
geom_stratum(alpha=0.6, reverse = FALSE)+
geom_text(stat="stratum", label.strata= TRUE, reverse = FALSE)+
ylab("Frequency")+xlab("Features")+
theme(legend.title = element_text(size=12))+
theme_minimal()

следующий график отображается с кодом выше

Я хочу построить графиктак что когда глюкоза "положительная", а ИМТ "высокая", она должна иметь одну красную линию, а не 5 линий, как в моем случае.

Я довольно новичок в программировании на R, и я изучаю различные библиотеки для создания этой блок-схемы.Я пробовал что-то с «аллювиальной» библиотекой, которая имеет эту функцию «слой», затем все сортируется по некоторому значению, в моем случае я сделал сортировку для Daibetes=="Negative", и график выглядел как график с использованием аллювиальной библиотеки, отсортированный как всекрасные линии над синей линией в каждом случае

Я хочу сделать что-то подобное, используя ggalluvial.С нетерпением ждем, чтобы привести.Заранее спасибо.

1 Ответ

0 голосов
/ 24 октября 2018

Вам необходимо установить aes.bind = TRUE в geom_alluvium(), который передается в stat_flow(), который при построении графика устанавливает приоритеты эстетики над осями.

ggplot(dat3d,aes(axis1= Diabetes, axis2=Glucose, axis3 = BMI, y = freq3d)) +
  geom_alluvium(aes(fill=Diabetes),aes.bind=TRUE, reverse = FALSE) +
  scale_fill_manual(labels = c("Negative", "Positive"), values = c("blue", "red")) +
  scale_x_discrete(limits = c("Diabetes", "Glucose", "BMI"), expand = c(.001, .001)) +
  geom_stratum(alpha=0.6, reverse = FALSE) +
  geom_text(stat="stratum", label.strata= TRUE, reverse = FALSE) +
  ylab("Frequency")+xlab("Features") +
  theme(legend.title = element_text(size=12)) +
  theme_minimal()

enter image description here

...