У меня есть HTML-документ, который состоит из нескольких ссылок, мне нужно изменить ссылки из этого HTML-документа на новый.Пример: входной HTML-документ: https://stackoverflow.com">stackoverflow https://stackoverflow1.com">stackoverflow1
выходной HTML-документ: stackoverflow stackoverflow1
Я использую парсер jsoup для получения списка всех ссылок из моего документа.И я сталкиваюсь с трудностями при замене ссылок в html-файле.
Ниже приведен мой фрагмент кода: после выполнения кода мой test.html не обновляется новыми ссылками.
Path path = Paths.get("test.html");
Charset charset = StandardCharsets.UTF_8;
Document doc;
try {
doc = Jsoup.parse(new File("test.html"), "UTF-8");
Element content = doc.getElementById("ExtractLinks");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
System.out.println("URL:" + linkHref);
String fileContent = new String(Files.readAllBytes(path), charset);
fileContent = fileContent.replaceAll(linkHref, "www.google.com");
Files.write(path, fileContent.getBytes(charset));
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}