Увеличение наб. в dataframe после использования слияния, но различий не найдено с помощью setdiff ()? - PullRequest
0 голосов
/ 11 октября 2019

Я объединил два dfs, чтобы назначить символ гена соответствующему идентификатору гена, используя:

PBA_BA1_FDR_named <- merge(PBA_BA1_FDR, 
                               lookuptable, 
                               by.x = "row.names", 
                               by.y = "ensembl_gene_id")

В моем оригинальном df (не содержащем символы гена) есть 8964 obs. После слияния (которое, похоже, сработало) новый df содержит 8996 obs. Я сделал это с двумя другими фреймами данных, и оба увеличились на 20-30 единиц. Я не могу понять, почему это произошло, поскольку никакие идентификаторы генов не должны были быть добавлены к общему набору, существующий идентификатор гена должен просто получить соответствующий символ гена, который добавляется к df в новом столбце.

Чтобы найти разницу между двумя, я использовал

setdiff(PBA_BA1_FDR_named$Row.names, row.names(PBA_BA1_FDR)) 

и получил

character(0)

в качестве возврата.

Есть ли другой способвыяснить, что это за дополнительные дополнения? Спасибо

...