PHP SimpleHTMLDom Извлечение - PullRequest
0 голосов
/ 18 марта 2012

Я хочу получить имя и URL из первого столбца таблицы: http://www.pferd -aktuell.de / fn-service / pferdebranchenbuch / kategorie-uebersicht / 13 / FN-Vereine И ПОТОМПройдите через кнопку СЛЕДУЮЩАЯ, чтобы получить все такие вхождения Имен и их URL со всех доступных страниц.Я пробовал что-то вроде этого, и ничего не выводилось.

<?php

include('simplehtmldom/simple_html_dom.php');
ini_set('max_execution_time', 1800);

$url = 'http://www.pferd-aktuell.de/fn-service/pferdebranchenbuch/kategorie-uebersicht/13/FN-Vereine';
$html = file_get_html($url);
$file = 'Titels.txt';

    if (!$fp = fopen($file, 'a+')) {
        echo "Cannot open file ($file)";
        exit;
        } 
    else {
        for ($i=1; $i<=25; $i=$i+1)
        {
            $ret = $html->find('td[class]="withBorder bold"', $i);
            fwrite( $fp, $ret->plaintext."\n");
        }
    }

}

После извлечения Titel и URL я планирую перемещаться по каждому из этих URL и иметь возможность извлечь некоторыетоже оттуда (например, Ort, Email и т. д.).

Какой-нибудь пример кода, который поможет мне начать?Пожалуйста:)

1 Ответ

0 голосов
/ 18 марта 2012

Вызов find (), вероятно, должен быть:

$ret = $html->find('td[class="withBorder bold"]', $i);
                                              ^---note the new location

Как написано, вы ищете любой td, который HAS атрибут класса, за которым следует бессмысленный = htmlэлемент.

...