Мне нужно выполнить несколько действий с html-файлом, например удалить определенный тег или удалить атрибуты. Я решил использовать HTML Parser, библиотеку Java:
http://htmlparser.sourceforge.net/
Прежде всего, я хочу удалить все теги стилей. Мне удалось получить NodeList, содержащий все теги стилей, выполнив это:
Parser parser = new Parser (url);
NodeList list = parser.parse (null);
NodeList styles = list.extractAllNodesThatMatch (new TagNameFilter ("STYLE"), true);
Теперь я не знаю, как удалить атрибуты этого стиля из всего списка узлов. Должен ли я получить весь список?
После этого я хочу иметь возможность удалить все атрибуты внутри тегов или, например, удалить только атрибуты alt. Есть ли метод, который делает это автоматически?