Я объединил два dfs, чтобы назначить символ гена соответствующему идентификатору гена, используя:
PBA_BA1_FDR_named <- merge(PBA_BA1_FDR,
lookuptable,
by.x = "row.names",
by.y = "ensembl_gene_id")
В моем оригинальном df (не содержащем символы гена) есть 8964 obs. После слияния (которое, похоже, сработало) новый df содержит 8996 obs. Я сделал это с двумя другими фреймами данных, и оба увеличились на 20-30 единиц. Я не могу понять, почему это произошло, поскольку никакие идентификаторы генов не должны были быть добавлены к общему набору, существующий идентификатор гена должен просто получить соответствующий символ гена, который добавляется к df в новом столбце.
Чтобы найти разницу между двумя, я использовал
setdiff(PBA_BA1_FDR_named$Row.names, row.names(PBA_BA1_FDR))
и получил
character(0)
в качестве возврата.
Есть ли другой способвыяснить, что это за дополнительные дополнения? Спасибо