фильтр файла gff3 для полного гена - PullRequest
0 голосов
/ 21 апреля 2019

У меня есть файл gff3 с полной последовательностью длины.Но немногие из полных последовательностей имеют несколько UTR.Я хочу отфильтровать их.Есть ли какая-либо утилита, которая доступна?

scaffold105size588288 transdecoder gene 130390 132407 . + . 
scaffold105size588288 transdecoder mRNA 130390 132407 . + . 
scaffold105size588288 transdecoder five_prime_UTR 130390 130818 . + . 
scaffold105size588288 transdecoder exon 130390 132407 . + . 
scaffold105size588288 transdecoder CDS 130819 131979 . + 0 
scaffold105size588288 transdecoder three_prime_UTR 131980 132407 . + .

scaffold105size588288 transdecoder gene 278652 281390 . + . 
scaffold105size588288 transdecoder mRNA 278652 281390 . + . 
scaffold105size588288 transdecoder five_prime_UTR 278652 278776 . + . 
scaffold105size588288 transdecoder exon 278652 278847 . + . 
scaffold105size588288 transdecoder CDS 278777 278847 . + 0 
scaffold105size588288 transdecoder exon 279283 280020 . + . 
scaffold105size588288 transdecoder CDS 279283 279589 . + 1 
scaffold105size588288 transdecoder exon 280311 280393 . + . 
scaffold105size588288 transdecoder three_prime_UTR 280311 280393 . + . 
scaffold105size588288 transdecoder three_prime_UTR 280593 280678 . + .
scaffold105size588288 transdecoder three_prime_UTR 280757 280812 . + .

В этом урезанном примере мне нужно удалить второй набор генов, поскольку он имеет 3 3'UTR, и сохранить первый, который является более полным набором.

Заранее спасибо.

...