У меня есть следующая строка:
raw_text=----- Start token date/time 07/05/2019 12:00 -----\r\n\r\n\r\n\r\n\t\r\n\r\n1989476 first name\t\r\n\r\n\t\r\n(Internet)\r\last-name \t\r\n\t\r\n\r\n\t\r\nA :\t\r\nSender\t\r\n\t\r\n\r\n\t23/04/2019 11:49\r\n\r\n\r\n________________________________\r\n\r\n\r\n\r\n\r\nThe first sentence
Я пытаюсь удалить все перед «первым предложением». Поэтому я использую регулярное выражение для захвата части, которую я хочу удалить. Вот что я сделал:
clean_text=re.sub(r'(-----)(.*)(____)[\\r\\n\]', '', raw_text)
Но это не работает. Кто-нибудь знает, как заставить это работать, пожалуйста? PS: я использую python 3,6 Спасибо
РЕДАКТИРОВАТЬ:
Проблема решена благодаря @Wiktor Stribiżew. Вот решение:
re.sub(r'-----.*____[\r\n]+', '', raw_text, flags=re.S)