Присвоить новые точки смешанного типа данных существующему кластеру PAM. - PullRequest
0 голосов
/ 23 сентября 2018

Я пытаюсь назначить новые данные существующим кластерам. У меня числовые и категориальные типы данных.Пример ниже похож на мой процесс.Фрейм данных "newdf" - это точки, которые я хотел бы назначить для кластеров PAM. Как бы я кодировал это в R?Любая помощь приветствуется, спасибо.

set.seed(1680)

library(dplyr) 
library(ISLR) 
library(cluster) 

college_clean <- College %>%
  mutate(name = row.names(.),
         accept_rate = Accept/Apps,
         isElite = cut(Top10perc,
                       breaks = c(0, 50, 100),
                       labels = c("Not Elite", "Elite"),
                       include.lowest = TRUE)) %>%
  mutate(isElite = factor(isElite)) %>%
  select(name, accept_rate, Outstate, Enroll,
         Grad.Rate, Private, isElite)



gower_dist <- daisy(college_clean[,-1],
                    metric = "gower",
                    type = list(logratio = 3))
pam_fit <- pam(gower_dist, diss = TRUE, k = 3)


newdf=data.frame(name=c("x_university","y_university","z_university"),
                accept_rate=c(.73,.50,.98),Outstate=c(10000,15000,5000),
                Enroll=c(500,1000,200),Grad.Rate=c(80,65,73),
                Private=c("Yes","No","No"),isElite=c("Elite","Not Elite", "Elite"))

1 Ответ

0 голосов
/ 23 сентября 2018

Это действительно просто, просто сделайте это.

Argmin расстояния до скопления медоидов.

...