Ваш ввод похож на ваш пример, и вам нужно получить текст между определенными тегами? Затем простой StringUtils.substringsBetween (yourString, "", "") с использованием пакета apache commons lang (http://commons.apache.org/lang/) должен выполнить эту работу.
Если вы ищете более общее решение для различных и, возможно, вложенных тегов, вы можете посмотреть на анализатор, который принимает ввод html и создает из него документ XML, такой как NekoHTML, TagSoup, jTidy. Затем вы можете использовать XPath в документе XML для доступа к содержимому.