Я хочу изменить все n
в последовательности на -
, но я не знаю, как заставить мой bash-скрипт не изменять n
, который отображается в именах последовательностей. У меня нет опыта в sed или regex, чтобы убедиться, что мой bash-скрипт читает только строки, которые не начинаются с >
, так как это указывает на заголовок.
Файл примера:
>Name_with_nnn
nnnatgcnnnatttg
>Name2_with_nnn
atgggnnnnGGtnnn
В то же время я хочу преобразовать все строчные буквы в прописные, только в последовательных строках. Я даже не знаю, как начать использовать sed, мне действительно сложно понять.
Ожидаемый результат:
>Name_with_nnn
---ATGC---ATTTG
>Name2_with_nnn
ATGGG----GGT---
Итак, после создания файлов последовательности я попытался продолжить свой сценарий с:
while IFS= read -r line
do
if [[ $line == ">"* ]]
then
echo "Ignoring header line: $line"
else
echo "Converting to uppercase and then N-to-gaps"
# sed or tr?? do call $line or do I call $OUTFILE? so confused..
fi
done