Я пытаюсь использовать jTidy для извлечения данных из (реального мира) HTML. Но jTidy не анализирует пользовательские теги.
<html>
<body>
<myCustomTag>some text</myCustomTag>
<anotherCustom>more text</anotherCustom>
</body>
</html>
Я не могу получить текст между пользовательскими тегами. Мне нужно использовать jTidy, потому что я буду использовать xpath.
Я пробовал HTMLCleaner, но он не поддерживает полные функции xpath.