Автоматическое извлечение организмов из нескольких выходов BLAST - PullRequest
0 голосов
/ 07 февраля 2019

В настоящее время я ищу способ извлечь имена совпадений организмов после BLASTing 20 файлов FASTA.В настоящее время у меня есть цикл for, который я использую для извлечения данных, чтения их, вывода имени файла, его вывода.Тем не менее, я должен вручную войти в каждый файл, чтобы найти соответствующий организм.Есть ли способ, которым я могу получить текстовый файл cat, созданный из прочитанных организмов.

for file in ./*.fsa
do 
name = `echo $file | awk -F "[./]" '{print $7}'`
echo $name
blastn -db nt -query $file -out ${name}.out -remote -outfmt "6 stitle"
done

Это будет делать все, что мне нужно, и, поскольку у меня есть только 20, это нормально, если нет, но я надеюсьувеличьте размер выборки и не хотите читать каждый файл для организмов X, найденных в выходных данных.

Редактировать: Чтобы уточнить, когда я читаю файлы .out, мне выдаются следующие результаты: BLAST + 2.XX версия

Homo sapiens (некоторый ген) E-значение% соответствия Escherichia coli (некоторый ген) E-значение% соответствия и т. Д.

последовательность соответствует запросу в базу данных.

То, что я хочу сделать, это собрать только линии вида, значение e и% соответствия.

Спасибо.

...