у меня два пути
path1 = "/home/x/nearline"
path2 = "/home/x/sge_jobs_output"
В path1 у меня есть несколько файлов fastq:
ERR001268_1.recal.fastq.gz
ERR001268_2.recal.fastq.gz
ERR001269_1.recal.fastq.gz
ERR001269_2.recal.fastq.gz
.............
В path2 у меня много .txt, соответствующих файлам fastq в path1:
ERR001268_1.txt
ERR001268_2.txt
ERR001269_1.txt
ERR001269_2.txt
.............
НЕТ. Я создал скрипт для расчета fastq_seq_num из файлов fastq в path1, см. Ниже:
for file in os.listdir(path1):
if re.match('.*\.recal.fastq.gz', file):
fullpath1 = os.path.join(path1, file)
#To calculate the sequence number in fastq.gz files
result = commands.getoutput('zcat ' + fullpath1 + ' |wc -l')
fastq_seq_num = int(result)/4.0
print file,fastq_seq_num
А также рассчитать num_seq_processed_sai из файлов .txt в path2, см. Ниже:
for file in os.listdir(path2):
if re.match('.*\.txt', file):
fullpath2 = os.path.join(path2, file)
#To calculate how many sequences have been processed in .sai file
linelist = open (fullpath2,'r').readlines
lastline = linelist[len(linelist)-1]
num_seq_processed_sai = lastline.split(']')[1].split()[0]
print file,num_seq_processed_sai
ОК, теперь моя проблема: я хочу создать цикл, в котором я вычисляю fastq_seq_num для FIRST-файла fastq в path1; затем вычислите num_seq_processed для первого текстового файла в path2; затем сравните эти два числа; затем закончите цикл. Затем начинается второй цикл ... Как я могу создать какой-то цикл для достижения этой цели? спасибо !!!