Я хотел бы завершить цикл после начала следующей записи.Например, представьте, что у меня есть следующий текстовый файл, состоящий из трех документов:
Document 1
text1
text1
tex1
Document 2
text2
text2
text2
Document 3
text3
text3
text3
Я пытаюсь создать файл JSON
, который объединяет каждый текст из одной статьи.например, 'body' = text1 text1 text1
;'body' = text2 text2 text2
;и 'body' = text2 text2 text2
.Для этого я ищу слово Document
, а затем объединяю текст, следующий за ним, в одну строку.Проблема в том, что мой код пропускает один документ, поэтому он работает только для документов 1 и 3:
for line in f:
if re.search(r"Document ", line):
text = ''
while not re.search(r"Document ", line):
text += line+' '
article['body'] = text
Есть идеи, как заставить код остановиться (while not
) при запуске следующего документа?