При создании файла с использованием GFF.write () я получаю новую строку с «примечанием к аннотации» в качестве источника, за которым следует ASCII-кодирование областей последовательности:
##gff-version 3
##sequence-region NC_011594.1 1 16779
NC_011594.1 annotation remark 1 16779 . . . gff-version=3;sequence-region=%28%27NC_011594.1%27%2C 0%2C 16971%29,%28%27NC_042493.1%27%2C 0%2C 132544852%29, (continues on and on)
NC_011594.1 RefSeq gene 1 1531 . + . Dbxref=GeneID:7055888;ID=gene-COX1;Name=COX1;gbkey=Gene;gene=COX1;gene_biotype=protein_coding
Любая идея, почему это здесь для чего и как мне этого избежать? Боюсь, это может стать проблемой при использовании его в сторонних программах.
Я импортировал только пакет bcbio-gff, но я считаю, что это часть Bio python, ссылка: https://biopython.org/wiki/GFF_Parsing