Получить текст с иностранной страницы в PHP - PullRequest
0 голосов
/ 19 июля 2011

Мне нужно извлечь фрагмент текста со страницы HTML, которого нет на моем локальном сайте, а затем проанализировать его как строку. В частности, последний столбец из этой страницы. Я предполагаю, что мне придется скопировать источник страницы в переменную, а затем настроить поиск по регулярному выражению, чтобы перейти к этой строке таблицы. Это самый эффективный способ сделать это? Какие функции PHP это повлечет за собой?

Ответы [ 2 ]

2 голосов
/ 19 июля 2011
  • Очистите HTML страницы с помощью file_get_contents () (для истины необходимо значение ini allow_url_fopen) или системной функции, такой как curl или wget
  • Запустите регулярное выражение, чтобы соответствовать нужной части. В этом случае вы можете просто сопоставить любые <td> s, так как эти значения являются первыми вхождениями ячеек таблицы, например, preg_match("/<td.*?>(.*?)<\/td>/si",$html,$matches); (не проверено)
1 голос
/ 19 июля 2011

Если вы можете использовать URL fopen, тогда будет достаточно простого file_get_contents ('http://somesite.com/somepage'). Существуют различные библиотеки для очистки веб-страниц, и это название того, что вы пытаетесь сделать.гибкий, чем куча регулярных выражений (регулярные выражения известны трудностью анализа сложных HTML / XML).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...