Bash: удалить HTML-тег со страницы - PullRequest
0 голосов
/ 19 июня 2019

У меня есть HTML-код

<div><img src="..." /></div>

и я хотел бы удалить из него тег img, чтобы получить:

<div></div>

Я написал скрипт bash с теми же командами, что и в emacs:

cat "$1"|sed 's/</\n</g'|sed 's/>/>\n/g'|sed 's/^<img.+//g' > "$2"

но это не сработало. Кажется, что sed не работает в разрывах строк. Есть предложения?

Я тоже пробовал:

sed 's/<img.+>//g'

но это удаляет слишком много кода.

Заранее спасибо.

1 Ответ

0 голосов
/ 19 июня 2019

Шаблон sed 's/<img[^>]*>//g', кажется, соответствует моим потребностям.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...