У меня большой df (формат CSV), который выглядит следующим образом:
miRNAs <- c('mmu_mir-1-3p','mmu_mir-1-5p','mmu-mir-6-5p','mmu-mir-6-3p')
cca <- c('12854','5489','54485','2563')
ccb <- c('124','589','5465','25893')
taa <- c('12854','589','5645','763')
df <- data.frame(miRNAs,cca,ccb,taa)
, и я хочу использовать этот df в анализе DESeq2. Я сделал этот df уникальным с помощью unique(df)
и попытался открыть с помощью countData <- as.matrix(read.csv(file="df.csv", row.name="miRNAs", sep = ","))
, но он выдает эту ошибку
Ошибка в read.table (file = file, header = header, sep = sep, quote = quote,: дубликаты 'row.names' не допускаются
Поскольку я сделал df unique
, я не знаю, почему эта ошибка продолжает появляться. Таким образом, df заключается в том, что я хочу получить список заголовков моих столбцов (except the first column)
, когда набираю colnames(df)
, потому что мне нужно выполнить тест FALSE TRUE, чтобы проверить, совпадают ли они с именами строк другого файла, называемого фенотипом. CSV all(rownames(phenotype) == colnames(countData))