У меня есть такая длинная строка:
Page Content
Director, Research Center.
Director of Research, Professor
Researcher
Строки заканчиваются двойным переводом строки. Некоторые содержат период в конце, некоторые нет. Я хочу, чтобы каждая строка с двойной новой строкой содержала один период и одну новую строку, например:
Page Content.
Director, Research Center.
Director of Research, Professor.
Researcher.
Существуют также строки, заканчивающиеся точкой и одной новой строкой, и они должны оставаться так они и есть. То, что я пробовал:
re.sub('(?!\.)\n\n', '.\n', text)
То, что я пытаюсь сделать, - это отрицание на период, за которым следуют две новые строки, или нахождение каждой двойной двойной новой строки, которая не имеет периода непосредственно перед этим, и замените его точкой и одной новой строкой.
Я пробовал некоторые другие варианты, но я всегда получаю либо двойной период, либо никаких изменений.