У меня есть грязный HTML, который выглядит следующим образом:
<div id=":0.page.0" class="page-element" style="width: 1620px;">
<div>
<img src="viewer_files/viewer_004.png" class="page-image" style="width: 800px; height: 1131px; display: none;">
<img src="viewer_files/viewer_005.png" class="page-image" style="width: 1600px;">
</div>
</div>// this repeats 100+ times with different 'src' attributes
Теперь это всего одна строка на самом деле (я отформатирован в несколько строк для удобства чтения).Я пытаюсь удалить все теги <img>
, для которых установлен display:none;
во встроенном CSS.Возможно ли использовать sed / awk или какую-либо другую команду unix для достижения этой цели?Я думаю, если бы это был документ с хорошим отступом, это было бы легко.