Как я могу извлечь контент определенного div с веб-страницы? - PullRequest
1 голос
/ 06 февраля 2012

Я хочу загрузить контент определенного div с помощью class='box' с веб-страницы, и я использовал Simple HTML DOM для этого.но я не могу написать четкий шаблон для preg_match, вот мой код php:

<code><?php
   $url = "http://www.example.com/pages/";
   $page_all = file_get_contents($url); 

   preg_match(...?);


   echo "<pre>";
   print_r($div_array[0]);
   echo "
";?>

Пожалуйста, помогите мне написать правильный шаблон дляpreg_match

Ответы [ 2 ]

2 голосов
/ 06 февраля 2012

SimpleHtmlDOM:

$html = new simple_html_dom();

// Load from a string
$html->load('<html><body><p>Hello World!</p><p>We're here</p></body></html>');

// Load a file
$html->load_file('http://net.tutsplus.com/');

# get an element representing the second paragraph  
$element = $html->find("div[class=box1]");

#access HTML attr
$element->innertext .= "Somthing";

#save and echo
echo $element->save();
1 голос
/ 06 февраля 2012

Вы должны проверить: http://simplehtmldom.sourceforge.net/

Примером может быть:

$html = new simple_html_dom();

$html = file_get_html('http://www.example.com/pages/');

$ret = $html->find('div[class=box]');

Не тратьте свое время на Regex, есть инструменты для работы.

...