Недавно меня спросили о подмножестве фрейма данных в R. У моего коллеги была эта строка кода
dd2 <- subset(dd, tret == c("T1", "T2", "T3", "T4"))
, что дает 1/4 от подмножества.В отличие от стандартного dd2 <- subset(dd, tret == "T1" | tret == "T2" | tret == "T3" | tret == "T4")
, который дает 960 строк, первая строка кода дает только 240 строк.
То же самое происходит с векторами.Например,
x <- c(1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4)
y <- x[x == 1 | x == 2] gives a vector different from
y <- x[x == c(1,2)]
Есть понимание различий?Спасибо.