Как частично загрузить удаленный файл с помощью cURL? - PullRequest
21 голосов
/ 09 января 2010

Возможно ли частично загрузить удаленный файл с помощью cURL? Допустим, фактический размер файла удаленного файла составляет 1000 КБ. Как я могу загрузить только первые 500 КБ?

Ответы [ 4 ]

35 голосов
/ 09 января 2010

Вы также можете установить параметр заголовка диапазона с расширением php-curl.

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.spiegel.de/');
curl_setopt($ch, CURLOPT_RANGE, '0-500');
curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$result = curl_exec($ch);
curl_close($ch);
echo $result;

Но, как отмечалось ранее, если сервер не соблюдает этот заголовок, а отправляет весь файл, curl загрузит его все. Например. http://www.php.net игнорирует заголовок. Но вы можете (дополнительно) установить обратный вызов функции записи и прервать запрос, когда будет получено больше данных, например,

// php 5.3+ only
// use function writefn($ch, $chunk) { ... } for earlier versions
$writefn = function($ch, $chunk) { 
  static $data='';
  static $limit = 500; // 500 bytes, it's only a test

  $len = strlen($data) + strlen($chunk);
  if ($len >= $limit ) {
    $data .= substr($chunk, 0, $limit-strlen($data));
    echo strlen($data) , ' ', $data;
    return -1;
  }

  $data .= $chunk;
  return strlen($chunk);
};

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.php.net/');
curl_setopt($ch, CURLOPT_RANGE, '0-500');
curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1);
curl_setopt($ch, CURLOPT_WRITEFUNCTION, $writefn);
$result = curl_exec($ch);
curl_close($ch);
17 голосов
/ 09 января 2010

Получите первые 100 байтов документа:

curl -r 0-99 http://www.get.this

из руководства

убедитесь, что у вас есть современный скручивание

2 голосов
/ 03 ноября 2016

Спасибо за приятное решение VolkerK. Однако мне нужно было использовать этот код как функцию, так что вот что я придумал. Я надеюсь, что это полезно для других. Основным отличием является use ($ limit, & $ datadump) , чтобы можно было передать лимит, и использовать переменную по ссылке $ datadump, чтобы иметь возможность вернуть его в результате. Я также добавил CURLOPT_USERAGENT, потому что некоторые веб-сайты не разрешают доступ без заголовка пользовательского агента.

Чек http://php.net/manual/en/functions.anonymous.php

function curl_get_contents_partial($url, $limit) {
  $writefn = function($ch, $chunk) use ($limit, &$datadump) { 
    static $data = '';

    $len = strlen($data) + strlen($chunk);
    if ($len >= $limit) {
      $data .= substr($chunk, 0, $limit - strlen($data));
      $datadump = $data;
      return -1;
    }
    $data .= $chunk;
    return strlen($chunk);
  };

  $ch = curl_init();
  curl_setopt($ch, CURLOPT_URL, $url);
  curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.13) Gecko/20080311 Firefox/2.0.0.13');
  //curl_setopt($ch, CURLOPT_RANGE, '0-1000'); //not honored by many sites, maybe just remove it altogether.
  curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1);
  curl_setopt($ch, CURLOPT_WRITEFUNCTION, $writefn);
  $data = curl_exec($ch);
  curl_close($ch);
  return $datadump;
}

использование:
$ page = curl_get_contents_partial ('http://some.webpage.com', 1000); // читаем первые 1000 байтов
echo $ page // или что угодно с результатом.

0 голосов
/ 09 января 2010

Это может быть вашим решением (загрузить первые 500 КБ в output.txt )

curl -r 0-511999 http://www.yourwebsite.com > output.txt
  • , в то время как 511999 равно 500^1024-1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...