Я пытаюсь заменить все символы, которые не являются C
, T
, A
или G
на N
в части последовательности файла fasta - т.е. каждая вторая строка
Я думаю, что мне понадобится некоторая комбинация awk и tr ...
Чтобы напечатать каждую вторую строку:
awk '{if (NR % 2 == 0) print $0}' myfile
Чтобы заменить эти символы на N
tr YRHIQ- N
... но я не знаю, как их объединить, чтобы замена символов происходила только на каждой 2-й строке, но печатала каждую строку
это то, что у меня есть
>SEQUENCE_1
AGCYGTQA-TGCTG
>SEQUENCE_2
AGGYGTQA-TGCTC
и я хочу, чтобы это выглядело так:
>SEQUENCE_1
AGCNGTNANTGCTG
>SEQUENCE_2
AGGNGTNANTGCTC
, но не так:
>SENUENCE_1
AGCNGTNANTGCTG
>SENUENCE_2
AGGNGTNANTGCTC