Я следую этому руководству , используя readxl для вставки моих данных . Я хочу использовать иерархическую кластеризацию для группировки исследований, и есть 12 наблюдений. В некоторых исследованиях отсутствуют данные, а в некоторых исследованиях вообще нет данных. Итак, следуя инструкции:
> df <-read_excel("MDO.xlsx")
> df <- na.omit(df)
> df <- scale(df)
Error in colMeans(x, na.rm = TRUE) : 'x' must be numeric
> d <- dist(df, method = "euclidean")
Warning message:
In dist(df, method = "euclidean") : NAs introduced by coercion
> hc1 <- hclust(d, method = "complete" )
Error in hclust(d, method = "complete") :
must have n >= 2 objects to cluster
Я довольно плохо знаком с R и никогда раньше не использовал кластеризацию, поэтому не знаю точно, как исправить эти ошибки