Мне нужно сохранить структуру исходного документа за вычетом лишенных тегов
Вы думали о XSLT?Это язык, специально разработанный для преобразования XML и вообще древовидных структур.
Это преобразование :
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" omit-xml-declaration="yes" indent="yes"/>
<xsl:strip-space elements="*"/>
<xsl:template match="node()|@*">
<xsl:copy>
<xsl:apply-templates select="node()|@*"/>
</xsl:copy>
</xsl:template>
<xsl:template match="b">
<xsl:apply-templates/>
</xsl:template>
</xsl:stylesheet>
при применении к любому документу XHTML, какодин ниже :
<html>
<head/>
<body>
<p> Hello, <b>World</b>!</p>
</body>
</html>
дает требуемый, правильный результат , в данном случае:
<html>
<head/>
<body>
<p> Hello, World!</p>
</body>
</html>