Я собираю данные из опубликованной электронной таблицы Google, и все, что мне нужно, - это информация внутри содержимого div (<div id="content">...</div>
)
Я знаю, что контент начинается с <div id="content">
и заканчиваетсякак </div><div id="footer">
Какой самый лучший / самый эффективный способ получить часть DOM, которая находится внутри?Я думал о регулярном выражении (см. Мой пример ниже), но оно не работает, и я не уверен, что оно настолько эффективно ...
header('Content-type: text/plain');
$foo = file_get_contents('https://docs.google.com/spreadsheet/pub?key=0Ahuij-1M3dgvdG8waTB0UWJDT3NsUEdqNVJTWXJNaFE&single=true&gid=0&output=html&ndplr=1');
$start = '<div id="content">';
$end = '<div id="footer">';
$foo = preg_replace("#$start(.*?)$end#",'$1',$foo);
echo $foo;
ОБНОВЛЕНИЕ
Я предполагаю, что другой вопрос, который у меня есть, заключается в том, проще ли использовать регулярное выражение с начальной и конечной точками, а не пытаться анализировать DOM, в котором могут быть ошибки, и затем извлекать нужную мне часть.Кажется, что регулярное выражение будет способ пойти, но хотел бы услышать ваше мнение.