Проблема с PHP - PullRequest
       40

Проблема с PHP

1 голос
/ 18 июня 2011

У меня есть скрипт, который извлекает страницу с сайта, используя cURL, и я пытаюсь разрезать ее построчно, затем извлечь то, что мне нужно, и удалить эту строку.Проблема в том, что иногда это дает мне правильную позицию элемента, а иногда это не зависит от того, какую строку он чередует.

Я пытаюсь использовать одну из этих страниц: http://www.gametracker.com/search/

код, который я использую:

while (strpos($contents, '<tr>'))
{
    $start = strpos($contents, '<tr>');
    $end = strpos($contents, '</tr>', $start) + 5;
    $rstring = substr($contents, $start, $end - $start);
    $contents = str_replace($rstring, '', $contents);
    //nameee
        $start = strpos($rstring, '[clantag]');
    $end = strpos($rstring, '</a>', $start);
    $name= trim(substr($rstring, $start, $end - $start));
    echo $name . '<br/>';
        //players
    $search = '<td class="c05 item_bgcolor_even">';
        $start = (strpos($rstring, $search) + strlen($search));
    $end = strpos($rstring, "</td>", $start);
    $players= trim(substr($rstring, $start, ($end - $start)));
    echo $players . '<br />';
    $map;
    $curPlayers;
    $maxPlayers;
    $ip;
}

Он получает имя сервера правильно, но когда дело доходит до игроков, одну строку я получаю, а другую - lor_odd "> 1230.

Ответы [ 2 ]

1 голос
/ 18 июня 2011

Это будет намного проще с DOM-парсером :

libxml_use_internal_errors(true);

$dom = new DOMDocument;
$dom->loadHTMLFile('http://www.gametracker.com/search/');
$xpath = new DOMXPath($dom);

// Get the rows from the search list
$rows = $xpath->query('//table[@class="table_lst table_lst_srs"]/tr');

for ($i=1; $i<$rows->length-1; $i++) {
    $row = $rows->item($i);

    // Get the columns for a row
    $cols = $row->getElementsByTagName('td');

    // Get the server name (3rd column)
    echo 'Name: '.trim($cols->item(2)->textContent).PHP_EOL;

    // Get the player count (5th column)
    echo 'Players: '.trim($cols->item(4)->textContent).PHP_EOL.PHP_EOL;
}

Выходы:

Name: NoobonicPlague.com | 24/7 RP, FastDL, Custom Mods
Players: 55/65

Name: RUS Coop-20 Semantic #1 (2.0.7.0)
Players: 20/20

Name: TAW.net -(Dallas)
Players: 32/32

Name: Dedicated
Players: 0/12

...
1 голос
/ 18 июня 2011

Вы пишете «неправильный» код для такой обработки. Это трудно понять и поддерживать, не говоря уже об отладке.

Если вы захотите отказаться от ручного анализа HTML и использовать вместо него XPath запросов, ваша жизнь станет намного проще:

$doc = new DOMDocument();
$doc->loadHTML($contents); // $contents = the HTML that curl returns

$xpath = new DOMXPath($doc);

// You can now use as many XPath queries as you like; they look like this:
$nodes = $xpath->query(''); // you own query expression here
foreach ($nodes as $node) {
    $v = $node->nodeValue; // now do something with $v
}
...