Разбор HTML-структуры - PullRequest
       15

Разбор HTML-структуры

1 голос
/ 07 ноября 2011

Мне нужно разобрать источник html, чтобы получить ссылки ...

Предположим, у нас есть:

<html>
<head>....</head>
<body>
  <div ....>
   ....
     <a href="link0">
     <div class="class1">
       <a href="link1">
      </div>
     <a href="link2">
  </div>
</body>
</html>

Я хочу только link1, который является потомком div с классом class1

Я действительно не могу понять ...

Ответы [ 3 ]

0 голосов
/ 07 ноября 2011
0 голосов
/ 07 ноября 2011

Easy ...

В ActionScript вам нужно получить ваш HTML-источник в виде строки.Затем вам нужно искать этот div с помощью регулярных выражений.

var s:String="my html source";
var regex:RegExp=/<div.*?class="class1".*?>.*?<a.*?href="(.*?)".*?>(.*?)<\/a>/gi;

var o:Array=regex.exec(s);

trace(o[1]); //Gives you the href
trace(o[2]); //Gives you the anchortext
0 голосов
/ 07 ноября 2011

Я не знаю о ActionScript, но я бы посоветовал вам не пытаться заново изобретать колесо. Для ActionScript должен быть доступен некоторый анализатор XML. Используй это. Для начала обратитесь к учебному пособию по W3CSchools . Я повторяю - используйте парсер, не пишите его сами, если у вас нет очень веских причин для этого.

...