проблема с очисткой веб-страницы - PullRequest
0 голосов
/ 10 июня 2011

У меня большая проблема. Я хочу проанализировать веб-страницу с помощью php. И я не понимаю, почему это не работает. Я хочу взять теги "tr" с этой страницы, а затем проанализирую каждый полученный ранее текст по тегам "td". Дело в том, что я не могу разобрать текст, поэтому между двумя тегами могут быть еще два.

Есть ли какая-нибудь хитрость в том, что я должен знать? Потому что я пробую это более 2 дней, и все еще не могу получить результат.

Это страница:

http://www.tjareborg.fi/akkilahdot?DepartureIds=-1&CtryId=-1&DestinationAirportIds=-1&ResId=-1&QueryDurID=a&QueryDepDate=10.6.2011&LmsTypeId=2%2c3%2c1&PaxPrice=2167&SortAscending=True&page=0

Все, что я хочу сделать, - это проанализировать эту таблицу и получить содержимое каждой ячейки.

Спасибо большое !!!

Ответы [ 2 ]

2 голосов
/ 10 июня 2011

Попробуйте:

libxml_use_internal_errors(true);

$url = '%your url%';
$dom = new DOMDocument;
$dom->loadHTML(file_get_contents($url));

libxml_clear_errors();

$xpath = new DOMXPath($dom);
$rows = array();
foreach ($xpath->query('//*[@id="tblLmsList"]//tr') as $tr) {
    $cells = array();
    foreach ($xpath->query('td', $tr) as $td) {
        $cells[] = trim($td->nodeValue);
    }

    if (sizeof($cells) > 0) {
        $rows[] = $cells;
    }
}

print_r($rows);

Вывод :

Array
(
    [0] => Array
        (
            [0] => la 11.6.
            [1] => Varna
                Bulgaria
            [2] => Helsinki
            [3] => Matkajokeri
            [4] => 175,-
            [5] => 
            [6] => -
            [7] => 
            [8] => -
            [9] => 
        )

    [1] => Array
        (
            [0] => la 11.6.
            [1] => Varna
                Bulgaria
            [2] => Helsinki
            [3] => Pelkät lennot
            [4] => 150,-
            [5] => 
            [6] => -
            [7] => 
            [8] => -
            [9] => 
        )

...
1 голос
/ 10 июня 2011

Попробуйте взглянуть на http://simplehtmldom.sourceforge.net/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...