Спасибо за ответы, я был не прав.Проблема была не в этих HTML-тегах.Поскольку html-страница, которую я хотел преобразовать, содержала недопустимые символы xml, поэтому я не смог ее преобразовать.
Я нашел решение, используя XMLChar.isValid метод библиотеки Xerces.Кроме того, мне пришлось удалить все теги script и style htmlpage с этим кодом:
final DomNodeList<HtmlElement> scriptElements = html.getElementsByTagName("script");
if (!scriptElements.isEmpty()){
for (HtmlElement scriptElement : scriptElements){
scriptElement.removeAllChildren();
}
}