Я пытаюсь получить красивый (очищенный) текстовый контент из JTextPane.Вот пример кода из JTextPane
:
JTextPane textPane = new JTextPane ();
textPane.setContentType ("text/html");
textPane.setText ("This <b>is</b> a <b>test</b>.");
String text = textPane.getText ();
System.out.println (text);
Текст выглядит следующим образом: JTexPane
:
Этот является a test .
Я получаю такой тип печати на консоль:
<html>
<head>
</head>
<body>
This <b>is</b> a <b>test</b>.
</body>
</html>
Я использовал substring()
и / или replace()
код, но неудобноиспользуйте:
String text = textPane.getText ().replace ("<html> ... <body>\n , "");
Есть ли какая-нибудь простая функция для удаления всех других тегов, кроме <b>
тегов (содержимого) из строки?
Иногда JTextPane
добавить <p>
тегов вокруг содержимого, чтобыЯ тоже хочу от них избавиться.
Вот так:
<html>
<head>
</head>
<body>
<p style="margin-top: 0">
hdfhdfgh
</p>
</body>
</html>
Я хочу получать только текстовое содержимое с тегами:
This <b>is</b> a <b>test</b>.