Я хотел бы понять, как лучше всего использовать bwa параллельно в кластере SLURM. Очевидно, это будет зависеть от вычислительных ограничений, которые у меня есть как у пользователя.
Программное обеспечение bwa имеет аргумент "-t", указывающий количество потоков. Давайте представим, что я использую bwa mem -t 3 ref.fa sampleA.fq.gz
, это будет означать, что bwa разделит работу на три задачи / потоки. Другими словами, он выровняет три чтения одновременно (я думаю).
Теперь, если я хочу выполнить эту команду на нескольких примерах и в кластере SLURM, я должен указать количество задач, как для bwa mem, и указать количество процессоров на задачу (например, 2)? Который будет:
sbatch -c 2 -n 3 bwa.sh
где bwa.sh содержит:
cat data.info | while read indv; do
bwa mem -t 3 ref.fa sample${indv}.fq.gz
done
У вас есть предложения? Или вы можете улучшить / исправить мои рассуждения?