Моя проблема больше в том, как переименовать строку заголовка для каждой последовательности fastta, поскольку я знаю, как объединить несколько файлов fasta в один файл.Проблема в том, что после создания моих файлов каждый файл имеет точно такой же заголовок (имя гена, который был проанализирован).Поэтому я хочу просто объединить последовательности, но вместо того, чтобы сохранить один и тот же заголовок, я хочу использовать имя файла в качестве заголовка.
Например, у меня есть два файла fastta, первый из которых:
Homo_sapien_XYZ_20102.fa
И внутри этого файла последовательность:
>gene_X
ACTGAGGCCAATGAA...
Затем второй файл с именем:
Homo_sapein_ABC_20102.fa
>gene_X
CCCTGAGTAGAT...
Когда я объединяю эти файлы, я получаю один новый файлкоторые имеют разные последовательности, но идентичные заголовки (и из-за природы сценариев, которые я использую для генерации этих отдельных последовательностей, я не могу изменить имя заголовка до этого шага).
>gene_X
ACTGAGGCCAATGAA...
>gene_X
CCCTGAGTAGAT...
Это будет проблематично, поэтому янадеялся переписать этот заголовок, используя имя файла, чтобы оно получилось:
>Homo_sapien_XYZ_20102
ACTGAGGCCAATGAA...
>Homo_sapein_ABC_20102
CCCTGAGTAGAT...
Кто-нибудь знает, как это сделать?Строка кода, которую я использовал для создания одного файла последовательностей, просто:
#!/bin/bash
for files in *_20102.fa
do
cat ${files} >> geneA_consensus.fa
done