Я изо всех сил пытался озаглавить этот пост, но, надеюсь, пример и объяснение ниже помогут.Я хотел бы создать древовидный график, который показывает частоту различных «путей» в моих данных.У меня есть следующий фрейм данных:
zed = data.frame(
node1 = c("A", "A", "A", "A", "A", "A", "A", "A"),
node2 = c("A", "B", "A", "B", "A", "B", "A", "B"),
node3 = c("B", "C", "D", "D", "C", "D", "C", "C"),
node4 = c("C", "C", "D", "D", "D", "D", "D", "C"),
stringsAsFactors = FALSE
)
, и я хотел бы создать график в R, который будет выглядеть примерно так (очень грубый эскиз, сделанный быстро в Excel):
По сути, каждая строка в кадре данных является путем.Все пути начинаются с «A», поэтому «A» является единственным верхним узлом, а затем (в этом примере) они переходят к B, C и D. Некоторые пути встречаются чаще, чем другие (A -> B ->C -> C появляется дважды, тогда как некоторые другие пути появляются один раз), и я думаю, я бы хотел, чтобы это отразилось на размере узлов.
Я не уверен, должен ли я переформатировать мои данные для этого, а также какая библиотека R-графиков лучше всего подходит для этого.Рад добавить больше контекста - любая помощь приветствуется !!