Как создать кластерные графики, которые долго и широко форматируют данные для нескольких переменных - PullRequest
0 голосов
/ 21 января 2020

Имея такой набор данных:

data.frame(id = c(1,1,1,2,2,3) snames  = c("stockA","stockB","stockC","stockA","stockB","stockc"), var1 = c(0.13,1.2,-1.5,3.45,-0.26,-2.1), var2 = c(-2.1,2.34,3.56,-1.53,-0.48,-0.29), var3 = c(0.04,-3.45,-0.22,-0.29,1.34,0.32), var4 = c(2.14,-1.34,-4.35,-1.56,0.13,-2.35), var5 = c(1.53,1.24,-0,32,-0.3,-4.25,-2.49))

Как можно создать кластер, используя данные в длинном и широком формате вместе?

Имея эти данные, можно ли как-то кластеризируем переменные столбца snames в комбинации с var1, var2, var3, var4, var5, чтобы найти, в каком кластере есть группа, как в первом кластере, у нас есть stockB и var2 и var3?

Like this один из здесь

1 Ответ

0 голосов
/ 22 января 2020

Я работал над вашим кодом, но вы должны предоставить мне больше информации, чтобы ответить на него

Во-первых, в вашем коде есть ошибки правописания, которые я вам предоставил, я исправил их здесь.

df<- data.frame(id=c(1,1,1,2,2,3),snames=c("stockA","stockB","stockC","stockA","stockB","stockC"), var1 = c(0.13,1.2,-1.5,3.45,-0.26,-2.1), var2 = c(-2.1,2.34,3.56,-1.53,-0.48,-0.29), var3 = c(0.04,-3.45,-0.22,-0.29,1.34,0.32), var4 = c(2.14,-1.34,-4.35,-1.56,0.13,-2.35), var5 = c(1.53,1.24,-0.32,-0.3,-4.25,-2.49)) # you wrote stockc and not stockC, also var5  was written -0,32, and it needs to be -0.32

укажите код, который вы использовали для построения приведенного выше графика.

Я полагаю, что вы можете просто определить уровни pch = (df $ snames) и col = c ("df $ vars1", "df $ vars2", "df $ vars3", "df $ vars4 "," df $ vars5 ") в команде plot, и она должна делать то, что вы хотите

...