У меня есть набор файлов в каталоге с такими именами, как:
"34_R1.fastq", "100_R1.fastq", "100_R2.fastq", "EF23_R1.fastq"
, и я хочу сделать разделенный пробелами список символов перед первым подчеркиванием, без дубликатов. Мой желаемый вывод только с файлами выше будет "34 100 EF23"
.
Я написал скрипт python, чтобы начать этот процесс, но я заметил, что вывод неправильный. Очевидно, что есть дубликаты, потому что я еще не написал код для их обработки, но это потому, что я не могу получить выходные данные для правильного разделения числовых / буквенных символов c перед подчеркиванием. Любые мысли о том, как мой код неверен?
# In directory with all files
import os
import re
file1 = open("RIL_list.txt", "a")
for filename in os.listdir("."):
m = re.split("_", filename)[0]
file1.writelines(' '.join(m))
file1.close()
Вывод неправильный, используя этот код, так как числа и буквы c разделяются в процессе. В итоге я получу file1
, содержащий что-то вроде "34 1 00 10 0E F2 3"
сверху.