У меня очень длинный текст, в котором некоторые строки не имеют кавычек, некоторые другие строки заключены в двойные кавычки, а некоторые другие лишь частично заключены в кавычки.
Вот выдержка(каждая строка является примером вышеупомянутых случаев):
#Example 1 (line with no quotation marks)
I thought all this over for two or three days, and then I reckoned I would see if there was anything in it.
#Example 2 (full line inside quotation marks)
"Why, my boy, you are all out of breath. Did you come for your interest?"
#Example 3 (only part of the line inside quotation marks)
"No, sir," I says, "I don't want to spend it.
Я пытаюсь найти регулярное выражение, которое найдет все строки, которые:
- Начните сnewline
- В начале ставить двойные кавычки
- В конце ставить двойные кавычки
Другими словами, строки, следующие за вторым примером выше. Я пробовал следующее:
import re
def my_pattern():
pattern = r'^\"(.+)\"$'
return re.compile(pattern, re.M | re.IGNORECASE)
Но я не получаю вывод, который хочу. Любые идеи о том, как я мог бы улучшить свое регулярное выражение?