Я новичок в Python и ищу помощь с проблемой извлечения.
У меня есть набор текстовых файлов, и мне нужно извлечь все специальные комбинации выражения ("C" + "ровно 9 цифр") и записать их в файл, включая имя файла текстового файла. Каждый случай выражения, которое я хочу поймать, начинается в начале новой строки и заканчивается "/n".
sample_text = """Some random text here
and here
and here
C123456789
some random text here
C987654321
and here
and here"""
Как должен выглядеть вывод (в выходном файле)
My_desired_output_file = "filename,C123456789,C987654321"
Пока мой код:
min_file_size = 5
def list_textfiles(directory, min_file_size): # Creates a list of all files stored in DIRECTORY ending on '.txt'
textfiles = []
for root, dirs, files in os.walk(directory):
for name in files:
filename = os.path.join(root, name)
if os.stat(filename).st_size > min_file_size:
textfiles.append(filename)
for filename in list_textfiles(temp_directory, min_file_size):
string = str(filename)
text = infile.read()
regex = ???
with open(filename, 'w', encoding="utf-8") as outfile:
outfile.write(regex)