php preg_match_all, regex, извлечь конкретное значение - PullRequest
0 голосов
/ 13 июля 2010

Я пытаюсь извлечь пользователей, которые задают вопросы на сайте объявлений (http://trademe.co.nz/Trade-Me-Motors/Cars/Toyota/Hiace/auction-300294634.htm). По некоторым причинам шаблон, который я использую, не всегда работает, поэтому я был бы признателен, если бы вы мне помоглис идеальным регулярным выражением Вот мой текущий код

/get memberid of the question asker
   $pattern = "//m";
   preg_match_all($pattern, $htmlContent, $member_match);

   $no_a = count($member_match[1];);            

   $inc = 0;

  echo "number of askers is $no_a";

  //make loop to get all the members
     while($inc ";
//get member user match based on the member_id
      $pattern2 = "/(.*)/";
     preg_match_all($pattern2, $htmlContent, $member_user_match);
      $bid_user_q = $member_user_match[1][0];
//store the askers
    mysql_query("INSERT INTO askers (id, item_number, bid_user_q, bid_member_id_q, sub_cat)
                             VALUES('', '$item_number', '$bid_user_q', '$bid_member_id_q', '$sub_cat')");
echo "INSERT INTO askers (id, item_number, bid_user_q, bid_member_id_q)
                             VALUES('', '$item_number', '$bid_user_q', '$bid_member_id_q', '$sub_cat')<br>";
mysql_error();
     $inc++; 

     }

Код, похоже, не отображается должным образом из-за тегов html из шаблона, поэтому вы можете увидеть его здесь http://pastebin.com/iPxizy5X

1 Ответ

0 голосов
/ 13 июля 2010

Я сомневаюсь, что это "идеально", но этот работал для меня:

/<small>\s*<a href=\"\/Members\/Listings\.aspx\?member=(\d+)\">\s*<b>(.*?)<\/b>/

Если вы используете:

$pattern = "/<small>\s*<a href=\"\/Members\/Listings\.aspx\?member=(\d+)\">\s*<b>(.*?)<\/b>/";
preg_match_all($pattern, $htmlContent, $member_match, PREG_SET_ORDER);

$ member_match [0] [1] = memberid $ member_match [0] [2] = ник участника $ member_match [1] [1] = идентификатор участника $ member_match [1] [2] = ник участника

...