Я пытаюсь построить «график присвоения», в котором вероятность принадлежности к трем группам показана в треугольнике с точкой в каждом наблюдении. Центр треугольника будет представлять наблюдения с равной вероятностью (которая составляет 33%) принадлежности к каждой из трех групп (Group1_prob
, Group2_Prob
, Group3_Prob
), а другие области в треугольнике будут представлять различные степени членство в группе. Эти наблюдения или точки имеют цвета в соответствии с Another_category
.
Я сгенерировал случайный набор данных с переменными, которые я упомянул выше, чтобы уточнить:
s <- seq(1, 100, 1)
a1 <- matrix(rbeta(100*3,2,2), nc=3)
a1 <- sweep(a1, 1, rowSums(a1), FUN="/")
category2 <- sample(c(1,2,3), 100, replace = TRUE)
df = data.frame(s, a1, category2)
colnames(df) <- c('observation', 'Group1_prob', 'Group2_prob', 'Group3_prob', 'Another_category')
Кадр данных будет выглядеть примерно так: ниже:
observation Group1_prob Group2_prob Group3_prob Another_category
1 0.20692290 0.5259100 0.2671671 1
2 0.32271247 0.4352754 0.2420121 3
3 0.26894997 0.2367609 0.4942891 2
4 0.51197553 0.2400177 0.2480067 3
5 0.29448485 0.3002781 0.4052370 2
6 0.39686890 0.1370191 0.4661120 2
7 0.33881746 0.2946256 0.3665570 3
8 0.36083040 0.3123024 0.3268672 1
9 0.05739799 0.1207381 0.8218639 3
Было бы это вообще возможно с ggplot2
в R?
A Nature Communications бумага от Young et al. отлично показывает этот сюжет: