Я пытаюсь выяснить, как удалить содержимое после закрывающего тега HTML , используя только bash или обычные инструменты GNU . Например, учитывая следующий HTML-шаблон, каким будет эффективный способ удалить завершающий комментарий, не касаясь встроенного комментария и не используя внешний язык, такой как Python?
<!DOCTYPE html>
<html>
<head>
<title>Site | Page 1</title>
</head>
<body>
<!-- Don't delete me! -->
</body>
</html>
<!--
Man, I really wish to vanish!
-->
Единственное, что я могу придумать, - это прочитать весь файл в память и обработать его там, то есть что-то архаичное, например, получение местоположения закрывающего тега HTML с помощью регулярных выражений, усечение после этого и запись обратно на диск.