Я понимаю, что вы не думаете, что вам нужен полноценный парсер - мы все в какой-то момент написали парсер HTML-регулярных выражений, думая: "Мой вариант использования очень прост, конечно, я могу использовать регулярное выражение это раз! "
Но я думаю, что каждый, кто ушел и сделал это, в конечном итоге приходит к выводу, что просто перенести тяжелую работу на один из множества превосходных существующих парсеров было бы быстрее, проще, проще и безопаснее. Я знаю, что у меня есть.
Проверьте jSoup - это просто, быстро и работает. Там действительно нет веских причин, чтобы не использовать его.
Если вы все еще не уверены, тот факт, что вы должны были прийти и спросить, каков был правильный образец - , и вы получили три разных ответа - ни один из которых не выполняет всю работу - должен надо сказать, что проблема гораздо сложнее, чем кажется на первый взгляд.