Я пытаюсь избавиться от определенного шаблона текста в моем файле .txt, который выглядит примерно так:
mystring = '''
example deletion words
in the first block
First sentence to keep.
example deletion words
in the second block
Second sentence to keep.
example deletion words
in the third block
Third sentence to keep.
example deletion words
in the fourth block'''
Мой желаемый результат будет выглядеть так:
"Первое предложение сохранить.
Второе предложение сохранить.
Третье предложение сохранить."
Так что же я? Я пытаюсь избавиться от всего текста между строками «пример» и «блок», включая сами строки. Любая идея, как я мог бы go об этом либо в R, либо в Python?
Извините, что забыл включить мою попытку с регулярным выражением, и просто спросил неожиданно и спасибо людям, которые приняли усилие ответить независимо. Мое рабочее решение с использованием regex и re package в python:
import re
cleanedtext = re.sub('\nexample.*?block','',mystring, flags=re.DOTALL)
print(cleanedtext)