Эта тема также связана с воспроизводимостью результатов: всегда лучше использовать исходный двоичный файл, предоставленный NCBI или UCSC, потому что это облегчит ваши результаты для воспроизведения другими учеными и спасет вас много времени ушло на написание тестов (больше времени, чем вы можете себе представить).
Для повседневной работы я часто использовал exonerate , инструмент, написанный на C, который может выполнять как глобальное, так и локальное выравнивание, имеет простой Unix-подобный интерфейс и не требует отформатировать ваш ввод как с Blast.
Кроме того, имейте в виду, что люди обычно используют комбинацию make-файлов и сценариев для определения конвейера вместо вызова всего из скрипта: большинство языков программирования не подходят для определения конвейеров, в то время как автоматизированные инструменты сборки, такие как Make, бесполезны для задач сценариев. Посмотрите на эти примеры: http://skam.sourceforge.net/skam-intro.html http://swc.scipy.org/lec/build.html