Внутреннее соединение не работает между двумя перекрывающимися фреймами данных в R - PullRequest
0 голосов
/ 07 ноября 2019

У меня есть две большие таблицы, каждая из которых имеет соответствующий столбец, который выглядит следующим образом:

> head(introns2$Name)
[1] "chr1:12058:12178" "chr1:12228:12612" "chr1:12698:12974" "chr1:12722:13220"
[5] "chr1:13053:13220" "chr1:13375:13452"

> head(sqtl2$cluster_pos)
[1] "chr1:259025:261550" "chr1:804222:807217" "chr1:804222:807217"
[4] "chr1:804222:807217" "chr1:804222:807217" "chr1:804222:807217"

Всякий раз, когда я запускаю следующую команду:

combined <- inner_join(sqtl2, introns2, by=c("cluster_pos"="Name"))

Я получаю combined таблица с 0 строками. До сих пор я убедился, что оба столбца имеют одинаковый тип, установив тип introns2$Name в char следующим образом: introns2$Name <- sapply(introns2$Name, as.character), и я попытался использовать не-1011 * способ сделать то же самое: combined <- merge(x=sqtl2,y=introns3,by.x="cluster_pos", by.y="Name")

Я предполагаю, что есть совпадения совпадений между этими двумя таблицами, так как они приходят из одного источника и имеют огромные размеры:

> nrow(introns2)
[1] 357746
> nrow(sqtl2)
[1] 1537363

Есть ли что-нибудь, чтоЯ с видом? Опять же, я просто хочу объединить две таблицы в каждой строке на основе совпадений, найденных в этих столбцах.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...