У меня есть текстовый файл с наборами текста, которые мне нужно извлечь, и выглядит примерно так:
ITEM A blah blah blah ITEM B bloo bloo bloo ITEM A blee blee blee ITEM B
Вот рабочий код, который у меня есть:
finda = r'(Item\sA)'
findb = r'(Item\sB)'
match_a = re.finditer(finda, usefile, 2) # the "2" is a flag to say ignore case
match_b = re.finditer(findb, usefile, 2)
Я знаю, что могу использовать такие команды, как span, start и end, чтобы найти позиции текста моих совпадений.Но мне нужно делать это много раз, поэтому мне нужно:
- начать писать в пункте A и прекратить писать в пункте B.
- , если эта первая итерация содержит менее 50 символовlong затем отбросьте и перейдите к следующему
- , как только вы найдете набор, который начинается с ITEM A и заканчивается ITEM B и длиной более 50 символов, запишите его в файл
Большое спасибо заранее!Я крутил свои колеса некоторое время.