Я пытаюсь назначить новые данные существующим кластерам. У меня числовые и категориальные типы данных.Пример ниже похож на мой процесс.Фрейм данных "newdf" - это точки, которые я хотел бы назначить для кластеров PAM. Как бы я кодировал это в R?Любая помощь приветствуется, спасибо.
set.seed(1680)
library(dplyr)
library(ISLR)
library(cluster)
college_clean <- College %>%
mutate(name = row.names(.),
accept_rate = Accept/Apps,
isElite = cut(Top10perc,
breaks = c(0, 50, 100),
labels = c("Not Elite", "Elite"),
include.lowest = TRUE)) %>%
mutate(isElite = factor(isElite)) %>%
select(name, accept_rate, Outstate, Enroll,
Grad.Rate, Private, isElite)
gower_dist <- daisy(college_clean[,-1],
metric = "gower",
type = list(logratio = 3))
pam_fit <- pam(gower_dist, diss = TRUE, k = 3)
newdf=data.frame(name=c("x_university","y_university","z_university"),
accept_rate=c(.73,.50,.98),Outstate=c(10000,15000,5000),
Enroll=c(500,1000,200),Grad.Rate=c(80,65,73),
Private=c("Yes","No","No"),isElite=c("Elite","Not Elite", "Elite"))