Я новичок в биоинформатике и недавно начал использовать локальную версию BLAST. Я пытаюсь получить согласованные результаты с моей ссылкой, которая является геном rpl26 из Alexandrium tamarense. В зависимости от того, использую я локальную или онлайн-версию blastn, я получаю разные результаты.
Как и ожидалось, я получил 500 хитов от этого. Однако, когда я пытаюсь:
/home/jedrzej/ncbi-blast-2.10.0+/bin/blastn -task blastn -query $query_path -db $db_path -out $out_name -outfmt "6 qseqid sseqid pident length mismatch qstart qend sstart send evalue bitscore sscinames scomnames sblastnames sskingdoms stitle"
, я получаю 511 хитов. Я подозревал, что параметры отличаются от онлайн-версии, поэтому я также попытался:
/home/jedrzej/ncbi-blast-2.10.0+/bin/blastn -task blastn -query $query_path -db $db_path -out $out_name -outfmt "6 qseqid sseqid pident length mismatch qstart qend sstart send evalue bitscore sscinames scomnames sblastnames sskingdoms stitle" -word_size 11 -gapopen 5 -gapextend 2 -penalty -3 -reward 2
Но результат был тот же. Max_target_seqs в blastn по умолчанию равен 500, поэтому я полагаю, что не должно быть более 500 обращений.
В качестве примечания я также попытался изменить max_target_seqs до 20000:
/home/jedrzej/ncbi-blast-2.10.0+/bin/blastn -task blastn -query $query_path -db $db_path -out $out_name -outfmt "6 qseqid sseqid pident length mismatch qstart qend sstart send evalue bitscore sscinames scomnames sblastnames sskingdoms stitle" -max_target_seqs 20000
Но это также отличается от результатов онлайн BLAST, когда я увеличиваю максимальные целевые последовательности до 20000. Я получаю 1980 (локальные) против 1950 (онлайн) хиты.
Почему я получаю разные результаты? Это проблема с базой данных?