Распределите наблюдения по группам - PullRequest
0 голосов
/ 07 января 2020

Мне было интересно, как лучше распределить мой набор данных. У меня есть набор данных с 3 кластерами. Исходя из апостериорных вероятностей, я хочу распределить респондентов по группам. Например, респондент 1 имеет: 0,10 шанса для кластера 1, 0,30 шанса для кластера 2 и 0,60 шанса для кластера 3. Как тогда распределить респондента 1 в кластер 3? Ниже приведен небольшой df:

dput(head(new1)[,c(1:3)])
structure(list(comp.1 = c(0.06, 0.03, 0, 0.03, 0, 0), comp.2 = c(0.61, 
0.42, 0.07, 0.41, 0.31, 0.41), comp.3 = c(0.33, 0.56, 0.93, 0.56, 
0.69, 0.59)), class = "data.frame", row.names = c("1", "2", "3", 
"4", "5", "6"))

В конце я хочу получить comp1, comp2 и comp3, все из которых заполнены апостериорными вероятностями, принадлежащими каждой группе.

Надеюсь, что вы можете помочь мне!

РЕДАКТИРОВАТЬ:

comp1 <- subset(new, new$comp.1 >= 0.6)
comp2 <- subset(new, new$comp.2 >= 0.6)
comp3 <- subset(new, new$comp.3 >= 0.6)

Выше я сделал то же самое, но мой учитель сказал мне, что я должен распределить респондентов по компонентам, основанным на самом высоком шансе, вместо определенного значения, что я сделал выше (0,6).

...