Я молодой исследователь в области биоинформатики.Я определил некоторую lincRNA и теперь я хочу сделать дифференциальную экспрессию гена, что я выравнивать индивидуальное состояние конкретного сырца чтение для этого идентифицированного lincRNA, который выглядит следующим образом:
SL3.0ch00: 1230877-1231088 GCCTATATATAGAGTACTAAATTCCTTAAAAAGGCATCTCGGAAGTTCCATAAATAGATCAAGATATCGAATAAACTAACGACCCTCGAATCATACAAAATCATGGAGAGTAGAATTAAGGGATCAATAGAATTGTACCGCTG
, потому что он межгенный, поэтому мне нужно создать свой собственный файл gtf, который выглядит следующим образом:
SL3.0ch00 myIntergenic intergenic 1230877 1231088 . + . gene_id "xxx"; transcript_id "SL3.0ch00:1230877-1231088";
SL3.0ch00 myIntergenic intergenic 1147815 1150318 . + . gene_id "xxx"; transcript_id "SL3.0ch00:1147815-1150318";
, а затем запустить featureCount с помощью следующей команды:
featureCounts -T 60 -F GTF -a a.gtf -o counts1.bed accepted_hits.bam
который дает ноль всем прочитанным.