Account_id <- c("00qwerf1”, “00uiowe3”, “11heooiue” , “11heooihe” ,
"00sdffrg3”, “03vthjygjj”, “11mpouhhu” , “1poihbusw”)
Postcode <- c(“EN8 7WD”, “EN7 9BB”, “EN6 8YQ”, “EN8 7TT”, “EN7 9BC”, “EN6
8YQ”, “EN8 7WD”, “EN7 7WB)
Age <- c(“30”, “35”, “40”, “50”, “60”, “32”, “34”, “45”)
DF <- data.frame(Account_id, Postcode, Age)
Я хочу провести кластерный анализ на моем фрейме данных в SAS. Я понимаю, что технически кадр данных не используется в SAS, однако я только использовал этот формат для иллюстрации. Account_id
и Postcode
являются символьными переменными, а Age
является числовой переменной.
Ниже приведен код, который я использовал после выполнения шага данных;
Proc fastclus data=DF maxc-8 maxiter=10 seed=5 out=clus;
Run;
Анализ кластера не работает, потому что Account_id
и Postcode
являются символьными переменными. Есть ли способ изменить эти переменные на числовые, или существует метод кластеризации, который работает как с символьными, так и с числовыми переменными?