Если, как вы говорите, у вас много больших файлов, я бы предложил обрабатывать их параллельно. Если проблема в том, что у вас проблемы с цитированием awk
, я бы предложил поместить ваш скрипт в отдельный файл, который называется, скажем, script.awk
, например:
(NR%4==2) {N1+=length($0);gsub(/[AT]/,"");N2+=length($0);}END{print N2/N1;}
Теперь вы можете просто обработать ихвсе параллельно с GNU Parallel :
find . -iname \*fastq.gz -print0 | parallel -0 gzcat {} \| awk -f ./script.awk