Нужна помощь в разборе html-строки
String str = "<div id=\"test\" ><a href=\"#aaaa\"> Amrit </a> </div><div><a href=\"#bbbb\" > Amrit </a> </div><a href=\"#cccc\" ><a href=\"#dddd\" >";
String reg = ".*(<\\s*a\\s+href\\s*=\\s*\\\"(.+?)\"\\s*>).*";
str - моя примерная строка и reg - мое регулярное выражение, используемое для анализа всех тегов привязки, особенно значения href.Используя это регулярное выражение, он показывает только последнюю часть строки.
Pattern MY_PATTERN = Pattern.compile(reg);
Matcher m = MY_PATTERN.matcher(str);
while (m.find()) {
for(int i=0; i<m.groupCount(); i++){
String s = m.group(i);
System.out.println("->" + s);
}
}
Это код, который я сделал.Чего не хватает?
А также, если я хочу, чтобы конкретное вхождение строки было заменено, как правило, если я изменил свой URL, изменил форму [string] _ [string] на [string] - [string].Как я могу получить "_" и заменить его на "-"?