У меня большой выходной файл BLAST (outfmt 6).Я заинтересован в поиске взаимных гомологов в этом файле, но я хочу исключить попадания с несколькими HSP, например.
Seq1 Seq2 (alignment 1: evalue bitscore etc)
Seq1 Seq2 (alignment 2: evalue bitscore etc)
Seq3 Seq4 (alignment 1: evalue bitscore etc)
Seq4 Seq5 (alignment 1: evalue bitscore etc)
Seq2 Seq1 (alignment 1: evalue bitscore etc)
Seq2 Seq1 (alignment 2: evalue bitscore etc)
Seq4 Seq3 (alignment 1: evalue bitscore etc)
В этом случае в качестве выравнивания между 1 будут возвращены только выравнивания между последовательностями 3 и 4.и 2 совместно используют несколько HSP, и выравнивания между 4 и 5 имеют только однонаправленное попадание.Я надеюсь сделать это в Python, чтобы я мог подключить его с остальной частью моей программы.
Кто-нибудь может посоветовать какие-либо потоки (и т.д.), которые могут привести меня в правильном направлении?
Спасибо!