Мне нужно переименовать все заголовки последовательностей в файле.
Заголовки начинаются в этом формате:
>D915_04184 transcript=D915_04184 gene=D915_04184
После этого они должны содержать только идентификатор последовательности в этом формате :
D915_04184
И мне нужно сделать это для каждой последовательности в файле.
Я пытался использовать sed, например
sed 's/'>D915' 'transcript=' 'gene='/D915/g' file_Name >new_file_name
Но у него не сработало. Я также пробовал делать grep -o
, но, похоже, это вообще ничего не дает.
Время от времени мне удается вытащить >
с самого начала, но не кажется избавиться от всего остального. 04184
должен оставаться, и этот номер отличается в каждой строке. >D915
согласован.