BLAST противоречивые результаты - PullRequest
0 голосов
/ 03 апреля 2020

Я новичок в биоинформатике и недавно начал использовать локальную версию BLAST. Я пытаюсь получить согласованные результаты с моей ссылкой, которая является геном rpl26 из Alexandrium tamarense. В зависимости от того, использую я локальную или онлайн-версию blastn, я получаю разные результаты. Here are my online blast parameters

Как и ожидалось, я получил 500 хитов от этого. Однако, когда я пытаюсь:

/home/jedrzej/ncbi-blast-2.10.0+/bin/blastn -task blastn -query $query_path -db $db_path -out $out_name -outfmt "6 qseqid sseqid pident length mismatch qstart qend sstart send evalue bitscore sscinames scomnames sblastnames sskingdoms stitle"

, я получаю 511 хитов. Я подозревал, что параметры отличаются от онлайн-версии, поэтому я также попытался:

/home/jedrzej/ncbi-blast-2.10.0+/bin/blastn -task blastn -query $query_path -db $db_path -out $out_name -outfmt "6 qseqid sseqid pident length mismatch qstart qend sstart send evalue bitscore sscinames scomnames sblastnames sskingdoms stitle" -word_size 11 -gapopen 5 -gapextend 2 -penalty -3 -reward 2

Но результат был тот же. Max_target_seqs в blastn по умолчанию равен 500, поэтому я полагаю, что не должно быть более 500 обращений.

В качестве примечания я также попытался изменить max_target_seqs до 20000:

/home/jedrzej/ncbi-blast-2.10.0+/bin/blastn -task blastn -query $query_path -db $db_path -out $out_name -outfmt "6 qseqid sseqid pident length mismatch qstart qend sstart send evalue bitscore sscinames scomnames sblastnames sskingdoms stitle" -max_target_seqs 20000

Но это также отличается от результатов онлайн BLAST, когда я увеличиваю максимальные целевые последовательности до 20000. Я получаю 1980 (локальные) против 1950 (онлайн) хиты.

Почему я получаю разные результаты? Это проблема с базой данных?

...