У меня есть некоторые данные с несколькими атрибутами. Я хотел бы попробовать иерархическую кластеризацию. В настоящее время я использую следующую строку
hc <- hclust(dist(users), method = "average")
Однако для определения расстояний используются все атрибуты, включая некоторые не относящиеся к делу, такие как идентификатор пользователя.
Как мне сказать функции dist
, чтобы использовать только некоторые атрибуты?