В MarkLogi c, вы можете использовать функцию xdmp:unquote()
с опцией repair-full
:
let $html := "<p>Some Text. </p><p><br></p><p>Another Text.</p><p><br></p><p>Bla bla bla.</p>"
let $xhtml := xdmp:unquote($html, "", "repair-full")
return $xhtml//text()
, которая будет возвращать последовательность text()
узлов. Если вы хотите одну строку, вы можете изменить возврат на fn:string-join($xhtml//text(), " ")
В BaseX , вы можете использовать html:parse()
метод
В Saxon вы можете использовать saxon:parse-html()
метод