Проблема с парсером GFF от BCBio - PullRequest
0 голосов
/ 21 апреля 2011

Я пытаюсь проанализировать файл GFF с помощью анализатора BCBio GFF, и я получаю следующую ошибку.Кто-нибудь может мне помочь в решении этой проблемы?

Traceback (последний последний вызов):

 File "gff_parse.py", line 6, in <module>
    for rec in GFF.parse(in_handle):
  File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 709, in parse
  File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 299, in parse_in_parts
  File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 320, in parse_simple
  File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 603, in _gff_process
  File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 634, in _lines_to_out_info
  File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 183, in _gff_line_map
ValueError: invalid literal for int() with base 10: 'New Start'

Вот мой код:

from BCBio import GFF    
in_file = "infile.gff"    
in_handle = open(in_file)
for rec in GFF.parse(in_handle):
    print rec
in_handle.close()

Спасибо, Тулика

1 Ответ

2 голосов
/ 21 апреля 2011

Как вы сгенерировали файл GFF?Кажется, он содержит хотя бы одну недопустимую строку.Четвертый столбец должен содержать целые числа для начальной координаты объекта;в сообщении об ошибке указывается, что вместо него содержится значение «Новый запуск».

На странице спецификации GFF3 есть несколько примеров допустимого GFF, и онлайн-валидатор может помочьОтладка вопросов форматирования, как это.

...