У меня есть файл .fasta с тысячами последовательностей, и название этих последовательностей выглядит следующим образом: "> JN935654.1 Abies alba tRNA-Leu (trnL) ген ....."
Я хочучтобы удалить регистрационный номер (= JN935654.1 в примере), и я использую следующий код:
sed 's/[^ ]* />/' file_1.fasta > file_2.fasta
Возвращает имя последовательности в виде: "> Abies alba tRNA-Leu (trnL) ген.... ".Номер доступа удален.
Я сам не писал этот код, но он делает именно то, что я хочу.Однако я не понимаю код.Может кто-нибудь объяснить это?Я новичок в терминале Ubuntu.
Я знаю, что команда sed - это некий текстовый редактор, а ^ & * - это какие-то специальные символы, которые учитываются для каждого числа.
Спасибо!