Проверка сохраненного размера файла HTML по сравнению с CURL size_download / download_content_length? - PullRequest
0 голосов
/ 03 февраля 2019

Всегда кажется, что он немного отключен.

При загрузке файла HTML с помощью CURL я пытаюсь убедиться, что размер сохраненного файла HTML соответствует размеру заголовков.

Minified:

    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $URL);
    $result = curl_exec($ch);
    $curlinfo = curl_getinfo($ch);

Помимо прочего, $curlinfo предоставляет следующую информацию:

[size_download] => 331650
[download_content_length] => 331650

(в моем опыте это всегда одно и то же значение)

Я пытался использовать mb_strlen

mb_strlen($result, 'utf8'); = 331495

mb_strlen($result); = 331495

Слегка выключен.

ИспользованиеDOM для сохранения файла

    $DOM = new DOMDocument();
    $DOM->preserveWhiteSpace = FALSE;
    libxml_use_internal_errors(true);
    $DOM->LoadHTML($result);
    $DOM->encoding = 'utf-8';
    $SaveHTMLfile = $DOM->saveHTMLFile($filename);

Проверка этого с помощью filesize($fileName);

Чуть больше ... FileSize: 332295

Конечно, если я изменю кодировку,или измените preserveWhiteSpace, установив значение filesize($filename), отклоняющееся так или иначе.отсутствует, что позволит мне проверить файл HTML, загруженный из внешнего источника до фактического байта?

...