Лучшим вариантом является использование некоторой библиотеки html-анализатора, но если вы не хотите использовать какую-либо такую стороннюю библиотеку, вы можете попытаться сделать это, сопоставив ее с регулярным выражением, используя java-классы Pattern и Matcher из пакета regex .
Редактировать
Пример:
String regex="\\b(?<=(href=\"))[^\"]*?(?=\")";
Pattern pattern = Pattern.compile(regex);
Matcher m = pattern.matcher(str_YourHtmlHere);
while(m.find()) {
System.out.println("FOUND: " + m.group());
}
В приведенном выше примере это простое базовое регулярное выражение, которое найдет все ссылки, обозначенные атрибутом href. Возможно, вам придется улучшить регулярное выражение для правильной обработки всех сценариев, таких как href с URL в одинарных кавычках и т. Д.