Вставка разрывов строк перед числами в тексте - PullRequest
0 голосов
/ 29 февраля 2012

У меня есть текст, который состоит из более чем 6000 строк, но я скопировал его из PDF и мне пришлось удалить все разрывы строк, потому что в PDF есть дополнительные разрывы строк в конце каждой видимой строки.

Так что теперь у меня получилось что-то вроде 1. textextexttexttexttext2. texttexttexttexttext3. texttexttexttext4. texttexttexttext ... texttexttext199. texttexttext200. texttexttext

Вопрос теперь в том, как поставить разрывы строк только перед числами с точкой и пробелом после них, чтобы получить:

1. textextexttexttexttext
2. texttexttexttexttext
3. texttexttexttext
4. texttexttexttext
... texttexttext
199. texttexttext
200. texttexttext

Было бы неплохо иметь алгоритм на PHP или Java.

Ответы [ 2 ]

0 голосов
/ 29 февраля 2012

Двойные разрывы строк звучат как возврат каретки Windows + перевод строки (CR + LF) (asc 13, asc 10).Возможно, возьмите оригинальную копию + вставленный текст и замените все экземпляры \r\n на \n

0 голосов
/ 29 февраля 2012

Замените регулярное выражение

(\d+\. )

на

\n$1

или

(?=\d+\. )

на

\n
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...