Простой HTML-анализатор для нескольких URL - PullRequest
1 голос
/ 03 марта 2011

Я разбираю нормально с одного URL, но как мне добавить второй исходный URL в тот же файл.

, например

$html = file_get_html('http://google.com');

для одного URL, но как добавить второй источник и заставить его работать с функцией "echo"?

Спасибо

1 Ответ

0 голосов
/ 03 марта 2011

Я не думаю, что большинство анализаторов позволят вам добавить недопустимые дублированные теги, такие как <head> и <body>.Вы можете попробовать сначала проанализировать оба URL и извлечь их тела:

$page1 = file_get_html('url1');
$body1 = $page1->find('body');

$page2 = file_get_html('url2');
$body2 = $page2->find('body');

Затем собрать их и проанализировать:

$body1 = $body1->plaintext;
$body2 = $body2->plaintext;
$bodies = str_get_html($body1.$body2);
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...