Я новичок в Python, и я использую его для своей магистерской диссертации, поэтому я не так много знаю.У меня есть несколько файлов годовых отчетов (в формате txt), и я хочу выделить весь текст между «ITEM1».и "ПУНКТ 2."Я использую повторный пакет.Моя проблема в том, что иногда, в этих 10ks, есть раздел под названием «ITEM1A».Я хочу, чтобы код распознал это и остановился на «ITEM1A».и поместите в вывод текст между «ITEM1».и "ITEM1A."В коде, который я прикрепил к этому сообщению, я попытался остановить его на «ITEM1A», но это не так, он продолжается дальше, потому что «ITEM1A».появляется несколько раз через файл.Я был бы идеальным, чтобы остановить это на первом, которое он видит.Код следующий:
import os
import re
#path to where 10k are
saved_path = "C:/Users/Adrian PC/Desktop/Thesis stuff/10k abbot/python/Multiple 10k/saved files/"
#path to where to save the txt with the selected text between ITEM 1 and ITEM 2
selected_path = "C:/Users/Adrian PC/Desktop/Thesis stuff/10k abbot/python/Multiple 10k/10k_select/"
#get a list of all the items in that specific folder and put it in a variable
list_txt = os.listdir(saved_path)
for text in list_txt:
file_path = saved_path+text
file = open(file_path,"r+", encoding="utf-8")
file_read = file.read()
# looking between ITEM 1 and ITEM 2
res = re.search(r'(ITEM[\s\S]*1\.[\w\W]*)(ITEM+[\s\S]*1A\.)', file_read)
item_text_section = res.group(1)
saved_file = open(selected_path + text, "w+", encoding="utf-8") # save the file with the complete names
saved_file.write(item_text_section) # write to the new text files with the selected text
saved_file.close() # close the file
print(text) #show the progress
file.close()
Если у кого-нибудь есть какие-либо предложения по решению этой проблемы, было бы здорово.Спасибо!