У меня есть HTML-файл с комментариями (некоторые могут быть вложенными)
<!-- Begin foo.html -->
<p>some html code</p>
<!-- Begin foo2.html -->
<p>some html code</p>
<!-- End foo2.html -->
<!-- End foo.html -->
<!-- Begin bar.html -->
<p>some html code</p>
<!-- End bar.html -->
Я пытаюсь разделить html-файл на foo.html, foo2.html и bar.html.
Номер блочного комментария не известен. как название блока.
Пока у меня есть эта линия awk
awk '/<!-- Begin (.*?)-->/ {f=$1} f{print > f} /<!-- End \1 -->/{close f; f=""}' index.html
Но это не работает должным образом.
Есть какие-нибудь мысли о том, как это исправить, или какой-нибудь альтернативный метод, который бы помог?