Как сделать небольшую php ссылку "паук" и извлечь данные? - PullRequest
0 голосов
/ 26 декабря 2011

Я хочу сделать паук на простом белом веб-сайте, который имеет множество HTML-ссылок, которые представляют номер телефона "имя и адрес. С каждой страницы я хочу извлечь 3 точных поля которые находятся между 3 TD, такими как:

    <div id="idTabResults2" align="center">
        <TABLE border='1'>
    <tr><th>Name</th><th>Adress</th><th>Phone number</th></tr>
    <TR>
          <TD>Joe</TD><TD>New York</TD><TD>555999</TD></TR>
    </TABLE>

    </div>

Так что в приведенном выше примере я получу «Джо», «Нью-Йорк» и 555999. Я использую php и mysql позже, чтобы вставить каждый результат в мою БД. Может кто-нибудь указать мне правильное направление, как это сделать?

Ответы [ 2 ]

1 голос
/ 26 декабря 2011

Возможно, более быстрый (и более простой) способ, чем решение PeeHaa:

Например:

<?php
require("simple_html_dom.php");
$data = file_get_contents(YOUR_PAGE_HERE);
$html = str_get_html($data);
$tds = $html->find('td');

foreach ($tds as $td) {
  // Do something
}
?> 
1 голос
/ 26 декабря 2011

Вы можете получить содержимое страницы, используя cURL .

Получив содержимое, вы можете проанализировать его с помощью PHP DOM .

Doне пытайтесь разобрать его с помощью регулярных выражений.Бог убьет котенка только для этого.

...