В настоящее время я ищу способ извлечь имена совпадений организмов после BLASTing 20 файлов FASTA.В настоящее время у меня есть цикл for, который я использую для извлечения данных, чтения их, вывода имени файла, его вывода.Тем не менее, я должен вручную войти в каждый файл, чтобы найти соответствующий организм.Есть ли способ, которым я могу получить текстовый файл cat, созданный из прочитанных организмов.
for file in ./*.fsa
do
name = `echo $file | awk -F "[./]" '{print $7}'`
echo $name
blastn -db nt -query $file -out ${name}.out -remote -outfmt "6 stitle"
done
Это будет делать все, что мне нужно, и, поскольку у меня есть только 20, это нормально, если нет, но я надеюсьувеличьте размер выборки и не хотите читать каждый файл для организмов X, найденных в выходных данных.
Редактировать: Чтобы уточнить, когда я читаю файлы .out, мне выдаются следующие результаты: BLAST + 2.XX версия
Homo sapiens (некоторый ген) E-значение% соответствия Escherichia coli (некоторый ген) E-значение% соответствия и т. Д.
последовательность соответствует запросу в базу данных.
То, что я хочу сделать, это собрать только линии вида, значение e и% соответствия.
Спасибо.