привет всем
У меня есть строка Java, которую я хочу
1- удалите из него все HTML-теги, кроме тегов новой строки <br>
и </br>
, и сохраните текст внутри тегов, если текст есть.
2 - после анализа текстовый результат соединяется друг с другом, как: text1 и text2, между текстами нет пробела, я тоже хочу это сделать.
вот что я делаю:
String html = "<div dir=\"ltr\">hello my friend<span>ECHO</span><br>how are you ?<br><br><div class=\"gmail_quote\">On Mon, Feb 14, 2011 at 10:45 AM, My Friend <span dir=\"ltr\"><<a href=\"mailto:notifications@mydomain.com\">notifications@mydomain.com</a>></span> wrote:<br> "
+ "<blockquote class=\"gmail_quote\" style=\"margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;\"> ";
String parsedText = html.replaceAll("\\<.*?\\>", "");
System.out.println(parsedText);
токовый выход:
hello my friendECHOhow are you ?On Mon, Feb 14, 2011 at 10:45 AM, My Friend <notifications@mydomain.com> wrote:
желаемый вывод:
hello my friend ECHO <br> how are you ? <br> <br> On Mon, Feb 14, 2011 at 10:45 AM, My Friend &`lt;notifications@mydomain.com> wrote:`