Почему мое регулярное выражение не работает, чтобы удалить раздел заголовка fastta - PullRequest
0 голосов
/ 24 апреля 2019

Я хочу удалить все между ">" и "Un_" в заголовке, таком как

>NW_017859640.1 Esox lucius isolate CL-BC-CA-002 unplaced genomic scaffold, Eluc_V3 Un_scaffold1210

Я пробовал несколько итераций регулярных выражений. Ничто, содержащее "*", кажется, не работает

sed 's/^NC_*Eluc_V3 //' 

и используя этот шаблон

sed 's/NC_*Eluc_V3 //'

В конце концов, я бы хотел

>Un_scaffold1210

1 Ответ

1 голос
/ 25 апреля 2019

Попробуйте с помощью:

sed 's/^>.*Un_/>Un_/'

Здесь я ищу > в начале строки, сопровождаемый вещами и заканчивающийся Un_, и заменяя эту строку просто >Un_.

Кажется, легче искать то, что вы сказали нам, которые являются вашими маркерами, чем пытаться угадать, что должно быть внутри этих маркеров, как вы пытаетесь это сделать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...