Я хотел бы напечатать идентификатор стенограммы и символ гена из заголовков файла rna fasta в текстовый файл.Я хотел бы закончить с текстовым файлом с первым столбцом, являющимся идентификатором транскрипта, и вторым, являющимся символом гена.
Пример заголовка:
>NM_001001258.1 Sus scrofa ATPase H+/K+ transporting beta subunit (ATP4B)
>XM_001924668.4 PREDICTED: Sus scrofa XK related 9 (XKR9), transcript variant X1, mRNA
Я былвозможность распечатать идентификатор стенограммы в текстовом файле:
grep "^>" GCF_000003025.6_Sscrofa11.1_rna.fna | tr -d '>' | awk '{print $1}' > test.txt
Я также смог напечатать символ гена в текстовом файле:
grep "^>" GCF_000003025.6_Sscrofa11.1_rna.fna | awk -F'[()]' '{print $2}' > test.txt
Мне просто интересно, есть ли кто-нибудьможет помочь мне объединить это в один шаг, чтобы получить один файл.Я знаю, что могу просто объединить файлы, но хочу быть уверенным, что идентификаторы идут из одних и тех же строк.