Как редактировать заголовок в быстрой последовательности, обрезая некоторые ее части и сохраняя основной текст последовательности с помощью командной строки linux? - PullRequest
0 голосов
/ 27 декабря 2018

У меня есть мультифаст-файл с именем fasta1.fasta, который содержит последовательности и их идентификаторы.Что я хочу, чтобы вырезать заголовок последовательности, которые имеют идентификатор и уменьшить его, чтобы содержать номер доступа ID последовательности только.Я использовал командную строку grep '>' fasta1.fasta | cut -d " " -f 1, чтобы вырезать части, которые я хочу из заголовка, но вывод, который я получаю, - это идентификационные номера идентификаторов только без остальной части последовательностей.Мои последовательности выглядят так:

>tr|Q8IBQ5|Q8IBQ5_PLAF7 40S ribosomal protein S10, putative OS=Plasmodium falciparum (isolate 3D7) OX=36329 GN=PF3D7_$
MDKQTLPHHKYSYIPKQNKKLIYEYLFKEGVIVVEKDAKIPRHPHLNVPNLHIMMTLKSL
KSRNYVEEKYNWKHQYFILNNEGIEYLREFLHLPPSIFPATLSKKTVNRAPKMDEDISRD
VRQPMGRGRAFDRRPFE
>tr|Q8IEB1|Q8IEB1_PLAF7 TBC domain protein, putative OS=Plasmodium falciparum (isolate 3D7) OX=36329 GN=PF3D7_132020$
MEYKLEFLSYLLIFKKKNERISKFDEQIKTCINIFEKSIINESDLKYLFERNILDMNPGV
RSMCWKLALKHLSLDSNKWNTELIEKKKLYEEYIKSFVINPYYSCVDNKKKEFVKETEKE
PKGKNMKDEYIEYNLDRNKTYYHKDDSLLKLQNDNNTKQMDYLEDEKYSSMDDECSEDNW

Вывод, который я получаю:

>tr|Q8IBQ5|Q8IBQ5_PLAF7

>tr|Q8IEB1|Q8IEB1_PLAF7

В то время как желаемый вывод:

>tr|Q8IBQ5|Q8IBQ5_PLAF7
MDKQTLPHHKYSYIPKQNKKLIYEYLFKEGVIVVEKDAKIPRHPHLNVPNLHIMMTLKSL
KSRNYVEEKYNWKHQYFILNNEGIEYLREFLHLPPSIFPATLSKKTVNRAPKMDEDISRD
VRQPMGRGRAFDRRPFE
>tr|Q8IEB1|Q8IEB1_PLAF7
EYKLEFLSYLLIFKKKNERISKFDEQIKTCINIFEKSIINESDLKYLFERNILDMNPGV
RSMCWKLALKHLSLDSNKWNTELIEKKKLYEEYIKSFVINPYYSCVDNKKKEFVKETEKE
PKGKNMKDEYIEYNLDRNKTYYHKDDSLLKLQNDNNTKQMDYLEDEKYSSMDDECSEDNW

Любая помощь будетоценили.Спасибо.

1 Ответ

0 голосов
/ 27 декабря 2018
  • Вариант 1:

    sed '/^>/s/ .*//'
    
  • Вариант 2:

    perl -pe 's/ .*// if /^>/'
    

То есть во всехстроки, начинающиеся с >, удаляют все после и после первого пробела.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...