Я пытаюсь выполнить некоторую очистку формата в текстовых файлах. Я хочу заменить все тройные (или более) новые строки двойными новыми строками и все двойные новые строки одной новой строкой. Сначала я открываю файл следующим образом:
text = ""
with open(filename) as fp:
for cnt, line in enumerate(fp):
text += line
, но заменяя новые строки следующим образом: text = re.sub(r'\n\n', '\n', text).strip()
или вот так text = text.replace("\n\n", "\n")
заменяет все (несколько) новых строк одной новой строкой.
Что я делаю не так?
Спасибо за любую помощь и объяснения.
Редактировать
Я хочу добиться чего-то вроде этого:
text text text text text text text text text text text text text text text
text text text text text text text text text text text text text text text
text text text text text text text text text text text text text text text
text text text text text text text text text text text text text text text
text text text text text text text text text text text text text text text
text text text text text text text text text text text text text text text
становится:
text text text text text text text text text text text text text text text
text text text text text text text text text text text text text text text
text text text text text text text text text text text text text text text
text text text text text text text text text text text text text text text
text text text text text text text text text text text text text text text
text text text text text text text text text text text text text text text