Используя BASE R, мне интересно, как ответить на следующий вопрос:
Существуют ли какие-либо значения в X
или Y
(то есть, представляющие интерес переменные), которые встречаются только в одном элементе в m
(как кластер) а не другие? Если да, выведите мой желаемый результат ниже.
Например: Здесь мы видим, что X == 3
происходит только в элементе m[[3]]
, но не m[[1]]
и m[[2]]
. Здесь мы также видим, что Y == 99
встречается только в m[[1]]
, но не в других.
Примечание: ниже приведен игрушечный пример, функциональный ответ приветствуется. И X
& Y
может быть или не быть числовым (например, быть строкой).
f <- data.frame(id = c(rep("AA",4), rep("BB",2), rep("CC",2)), X = c(1,1,1,1,1,1,3,3),
Y = c(99,99,99,99,6,6,6,6))
m <- split(f, f$id) # Here is `m`
mods <- names(f)[-1] # variables of interest names
Желаемый вывод:
list(AA = c(Y = 99), CC = c(X = 3))
# $AA
# Y
# 99
# $CC
# X
# 3