Как отключить загрузку изображений при использовании CURL? - PullRequest
0 голосов
/ 02 октября 2010

Я хочу загрузить сайт / URL, но мне не нужны изображения. Как исключить изображения из загрузки при использовании CURL

1 Ответ

2 голосов
/ 02 октября 2010

Результат вызова типа curl <url> дает вам только простую HTML-страницу и не загружает изображения. Но если вы хотите удалить теги img из загруженного HTML, вы можете применить простой XSLT с xmlstarlet .

Это XSLT (вариант, который я нашел в http://www.usingxml.com/Transforms/XslIdentity) delimg.xslt:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" 
 version="1.0">

  <!-- Remove img tag -->
  <xsl:template match="img" />

  <!-- IdentityTransform -->
  <xsl:template match="/ | @* | node()">
    <xsl:copy>
      <xsl:apply-templates select="@* | node()" />
    </xsl:copy>
  </xsl:template>

</xsl:stylesheet>

Затем вызовите xmlstarlet с опцией --html:

 curl <url> | xmlstarlet tr --html delimg.xslt > output.html
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...