Я пытаюсь прочитать что-то из тегов HTML, и я совершенно глуп, когда дело доходит до регулярных выражений (хотя у меня есть несколько шаблонов, но ни один из них не работает).
I 'Я читаю веб-страницу, просматривая эту строку: <td title='Visit Page for Demilict'><a href='personal.php?name=Demilict&c=s' class='idk' rel='Demilict' style='color: teal;'>Demilict</a></td>
Мне нужно извлечь из нее 'Demilict', и есть 3 возможности сделать это, как вы можете видеть.
Что будетлучшая позиция для его извлечения и как мне этого добиться?
Я также использую это, чтобы найти имена, так как мне нужно извлечь около 60 различных имен, и онивсе используют один и тот же формат, за исключением того, что имя может содержать только буквы, цифры и подчеркивания.
public void parse(String list) {
try {
URL url = new URL(list);
BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(url.openStream()));
String line;
StringBuilder stringBuilder = new StringBuilder();
while ((line = bufferedReader.readLine()) != null) {
stringBuilder.append(line).append("\n");
}
System.out.println(stringBuilder.toString());
Matcher matcher = namePattern.matcher(stringBuilder.toString());
if (matcher.find()) {
System.out.println("matched: " + matcher.group());
}
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}