PHP CURL получает открытый текст - PullRequest
2 голосов
/ 03 марта 2011

Я использую cURL в PHP для получения контента веб-страницы, и он отлично работает.Но теперь моя программа требует, чтобы я получал только текст с целевого сайта вместо HTML.Я много раз искал это, но, похоже, никто не нашел ответа.Я также попытался установить CURLOPT_TRANSFERTEXT=1 в моих параметрах cURL, но это, похоже, не влияет на результаты.

Есть идеи, почему это происходит?

Ответы [ 4 ]

2 голосов
/ 03 марта 2011

Убедитесь, что у вас есть следующее:

curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);

Возвращаемое значение curl_exec должно быть данными.

1 голос
/ 03 марта 2011

Я думаю, это то, что вы ищете:

<?
$address = file_get_contents('http://www.thesite.com/file.html');
echo $address;



$file = file_get_contents('./file.txt', true);

 or 

$file = file_get_contents('./file.txt', FILE_USE_INCLUDE_PATH);

?>
0 голосов
/ 03 марта 2011

Вы имеете в виду, что хотите удалить все HTML-теги на странице?

Просто используйте функцию strip_tags() .

0 голосов
/ 03 марта 2011

На самом деле мне нравится получать содержимое другой страницы.

<?php
function curl_get_file_contents($URL)
    {
        $c = curl_init();
        curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($c, CURLOPT_URL, $URL);
        $contents = curl_exec($c);
        curl_close($c);

        if ($contents) return $contents;
            else return FALSE;
    }


echo curl_get_file_contents("http://www.php.net");
?>

Но он возвращает мне весь контент.

...