У меня есть текстовый файл последовательностей символов, который состоит из двух строк: заголовка и самой последовательности в следующей строке.Структура файла выглядит следующим образом:
>header1
aaaaaaaaa
>header2
bbbbbbbbbbb
>header3
aaabbbaaaa
[...]
>headerN
aaabbaabaa
В другом файле у меня есть список заголовков последовательностей, которые я хотел бы удалить, например:
>header1
>header5
>header12
[...]
>header145
Идея состоит в том, чтобы удалить эти последовательности из первого файла, поэтому все эти заголовки + следующая строка.Я сделал это с помощью sed, как показано ниже:
while read line; do sed -i "/$line/,+1d" first_file.txt; done < second_file.txt
Это работает, но занимает довольно много времени, так как я загружаю весь файл несколько раз с помощью sed, и он довольно большой.Любая идея о том, как я мог бы ускорить этот процесс?