Я новичок в обработке данных RNA-seq. У меня есть данные RNA-seq о человеке, и теперь я пытаюсь подсчитать гены, используя summazeoverlaps, но я получаю это предупреждение для всех моих файлов:
"In .Seqinfo.mergexy (x, y): 2 объединенных объекта не имеют общих уровней последовательности. (Используйте suppressWarnings () для подавления этого предупреждения.) "
Вот что я сделал: я выровнял свои файлы seq RNA с эталонным файлом Ensembl (Homo_sapiens.GRCh38.cdna. all.fa.gz) и сгенерированные файлы BAM.
seqinfo(bamfiles)`
Seqinfo object with 190508 sequences from an unspecified genome:
seqnames seqlengths isCircular genome
ENST00000633009.1 20 <NA> <NA>
ENST00000634070.1 18 <NA> <NA>
ENST00000632963.1 20 <NA> <NA>
ENST00000633030.1 19 <NA> <NA>
ENST00000633765.1 31 <NA> <NA>
... ... ... ...
ENST00000638565.1 1331 <NA> <NA>
ENST00000673346.1 895 <NA> <NA>
ENST00000673247.1 369 <NA> <NA>
ENST00000672305.1 758 <NA> <NA>
ENST00000671911.1 943 <NA> <NA>
Я также скачал файл GTF из Ensembl: Homo_sapiens.GRCh38.100.gtf.gz
seqinfo(txdb)
Seqinfo object with 47 sequences (1 circular) from an unspecified genome; no seqlengths:
seqnames seqlengths isCircular genome
1 <NA> <NA> <NA>
2 <NA> <NA> <NA>
3 <NA> <NA> <NA>
4 <NA> <NA> <NA>
5 <NA> <NA> <NA>
... ... ... ...
KI270731.1 <NA> <NA> <NA>
KI270733.1 <NA> <NA> <NA>
KI270734.1 <NA> <NA> <NA>
KI270744.1 <NA> <NA> <NA>
KI270750.1 <NA> <NA> <NA>
Я предполагаю это как-то связано с seqnames, но я не уверен, что мне делать. Я пытался преобразовать его в стиль Ensembl: mapSeqlevels (seqlevels (bamfiles), "Ensembl") mapSeqlevels (seqlevels (txdb), "Ensembl"), но это ничего не делало ...
NB featurecounts не делает работать либо ...
Заранее спасибо! Sandra