У меня есть несколько файлов fasta, которые я хочу кластеризовать с помощью vsearch (https://github.com/torognes/vsearch) и сохранить "файл центроида" и "файл кластеризации-результатов" для каждого файла fasta.
Поскольку у меня много файлов, я планирую использовать возможности многопоточности vsearch, и я написал ниже l oop:
#!/bin/bash
# input fasta files
fastaFile=*.fasta
# vsearch cluster_fast loop
for f in $fastaFile
do
vsearch --cluster_fast \
$f \
--id 1 \
--qmask none \
--centroids $f.$centroids.txt \
--uc $f.uc.txt
done
К сожалению, это Похоже, многопоточность используется для каждого файла fasta одновременно, и я не могу понять, как организовать распараллеливание вне vsearch.