Java Regex Удаление пустых абзацев - PullRequest
3 голосов
/ 18 февраля 2012

В основном мне нужно удалить все пустые абзацы из текста.Кажется, что следующее не работает ...

String postLevel = content.replaceAll("<p>\\s*</p>", "");

Есть мысли о том, почему?

Не-ascii символы попали в строку как-то ..... Я удалил их, и этоработал.Lolz

Ответы [ 2 ]

2 голосов
/ 18 февраля 2012

Я бы попробовал это выражение вместо:

<p>\\s*</p>|<p/>

Это также позаботится о <p></p> и <p/> пустых абзацах.

0 голосов
/ 18 февраля 2012
String s = "<p> </p>";
s = s.replaceAll("<p>\\s+</p>","");
System.out.println("Result: " + s);

Выход:

Результат:

Я подозреваю, что ваша проблема не в том, как выглядит ваш вклад. У вас также будет проблема с тем, что регулярные выражения невероятно плохи при разборе HTML, и это, как правило, попытка «бить себя по голове».

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...