Вы уверены, что хотите удалить те строки, в которых дублируются значения Genes
? Это, по крайней мере, то, что делает этот код:
Y=X[which(!duplicated(X$Genes)),]
Таким образом, Y
содержит только уникальные Genes
значения. Если вы сравните nrow(Y)
и length(unique(X$Genes))
, то увидите, что результат одинаков:
nrow(Y); length(unique(X$Genes))
[1] 26
[1] 26
Если вы хотите удалить строки, содержащие повторяющиеся значения во всех столбцах , что возможно определение дублирующейся строки, тогда вы можете сделать это:
Y=X[!duplicated(X),]
Чтобы увидеть, как это работает, рассмотрим следующий пример:
df <- data.frame(
a = c(1,1,2,3),
b = c(1,1,3,4)
)
df
a b
1 1 1
2 1 1
3 2 3
4 3 4
df[!duplicated(df),]
a b
1 1 1
3 2 3
4 3 4