Как получить весь контент (HTML-код) любой веб-страницы, не на моем сервере по php - PullRequest
1 голос
/ 27 августа 2010

как получить весь контент (HTML Code) любой веб-страницы, не находящейся на моем сервере, по php

Ответы [ 2 ]

7 голосов
/ 27 августа 2010

Два простых способа распечатать содержимое (HTML) главной страницы google.com:

1) Использование file_get_contents()

<code><?php
$content = file_get_contents("http://www.google.com/");
echo '<pre>'.htmlspecialchars($content).'
'; ?>

Если этот метод не работает (из-за того, что обертки URL-адресов не включены, используйте второй метод ниже).

2) Использование cURL:

<code><?php
function file_get_contents_curl($url)
{
    $ch = curl_init();

    curl_setopt($ch, CURLOPT_HEADER, 0);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

    $data = curl_exec($ch);
    curl_close($ch);

    return $data;
}

$content = file_get_contents_curl("http://www.google.com/");
echo '<pre>'.htmlspecialchars($content).'
'; ?>
0 голосов
/ 27 августа 2010

Это довольно большая библиотека (~ 40 КБ), но PHP Simple HTML DOM Parser должен делать то, что вы хотите. :)

http://simplehtmldom.sourceforge.net/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...