Я пытаюсь взять строку с HTML, удалить некоторые теги (img, object) и все другие теги HTML, удалить их атрибуты.Например:
<div id="someId" style="color: #000000">
<p class="someClass">Some Text</p>
<img src="images/someimage.jpg" alt="" />
<a href="somelink.html">Some Link Text</a>
</div>
станет:
<div>
<p>Some Text</p>
Some Link Text
</div>
Я пытаюсь:
string.replaceAll("<\/?[img|object](\s\w+(\=\".*\")?)*\>", ""); //REMOVE img/object
Я не уверен, как удалить все атрибуты внутри тега, хотя.
Буду признателен за любую помощь.
Спасибо.