vsearch - кластеризация с многопоточностью - PullRequest
0 голосов
/ 04 мая 2020

У меня есть несколько файлов fasta, которые я хочу кластеризовать с помощью vsearch (https://github.com/torognes/vsearch) и сохранить "файл центроида" и "файл кластеризации-результатов" для каждого файла fasta.

Поскольку у меня много файлов, я планирую использовать возможности многопоточности vsearch, и я написал ниже l oop:

#!/bin/bash
# input fasta files
fastaFile=*.fasta

# vsearch cluster_fast loop
for f in $fastaFile
do
    vsearch --cluster_fast \
    $f \
    --id 1 \
    --qmask none \
    --centroids $f.$centroids.txt \
    --uc $f.uc.txt
done

К сожалению, это Похоже, многопоточность используется для каждого файла fasta одновременно, и я не могу понять, как организовать распараллеливание вне vsearch.

...