Результат вызова типа curl <url>
дает вам только простую HTML-страницу и не загружает изображения. Но если вы хотите удалить теги img из загруженного HTML, вы можете применить простой XSLT с xmlstarlet .
Это XSLT (вариант, который я нашел в http://www.usingxml.com/Transforms/XslIdentity) delimg.xslt
:
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
version="1.0">
<!-- Remove img tag -->
<xsl:template match="img" />
<!-- IdentityTransform -->
<xsl:template match="/ | @* | node()">
<xsl:copy>
<xsl:apply-templates select="@* | node()" />
</xsl:copy>
</xsl:template>
</xsl:stylesheet>
Затем вызовите xmlstarlet с опцией --html
:
curl <url> | xmlstarlet tr --html delimg.xslt > output.html