У меня есть коллекция из тысячи HTML-файлов, и мне нужно несколько обрезать их. Мне нужно удалить все теги в области <body></body>
из них, кроме одного, <div.pg>
, чтобы сделать их чистыми для печати. лишние - навигационные ссылки, которые делают распечатки грязными и заставляют страницы занимать больше бумаги. содержимое не одинаковое, поэтому я не могу найти и заменить фрагмент кода, но теги - это тот же пример, что и 3 <table>
тега, которые нужно удалить, каждый с определенным классом. манипулировать определенными тегами внутри пакетных файлов HTML?
Любая техника или программное обеспечение пакетной обработки для этой работы?
Какое простое решение для Windows?