чтение и извлечение данных из файла с использованием Python - PullRequest
0 голосов
/ 19 мая 2010

Я новичок в Python и хочу извлечь данные из этого формата

<seq id> <alignment start> <alignment end> <envelope start> <envelope end> <hmm acc> <hmm name> <type> <hmm start> <hmm end> <hmm length> <bit score> <E-value> <significance> <clan>

**FBpp0143497**      **5    151**      5    157 PF00339.22  **Arrestin_N**        Domain     1   135   149     83.4   **1.1e-23**   1 CL0135   
**FBpp0143497**    **183    323**    183    324 PF02752.15  Arrestin_C        Domain     1   137   138     58.5     **6e-16**   1 CL0135   
FBpp0131987     60    280     51    280 PF00089.19  Trypsin           Domain    14   219   219    127.7   3.7e-37   1 CL0124  

в этот формат

>FBpp0143497
 5      151        Arrestin_N     1.1e-23

>FBpp0143497
 183    323        Arrestin_C     6e-16

Ответы [ 3 ]

1 голос
/ 19 мая 2010

Поскольку это протеомные данные, вероятно, вы можете найти выделенные парсеры в пакете BioPython

1 голос
/ 19 мая 2010

Вы можете проанализировать файл с помощью модуля 'csv', используя пробел в качестве разделителя. Смотрите документацию для csv.reader

0 голосов
/ 01 апреля 2011

Вы можете использовать split (), чтобы отделить элементы от пробелов, а затем распечатать нужные значения из возвращенного списка.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...