Как я могу получить только значение href по ссылке - PullRequest
2 голосов
/ 20 мая 2009

У меня много ссылок на моей странице.

Например <a href="/promotions/download/schools/australia.aspx">Australia</a>

Теперь я хочу только href со значением i.e (href = "/ promotions / download / schools / australia.aspx") с регулярным выражением vbscript.

Ответы [ 2 ]

4 голосов
/ 20 мая 2009

мое регулярное выражение будет что-то вроде:

href="([^"]*)"

Возможно, вам нужно убежать в вашем контексте, но это (или что-то очень похожее) должно сработать.

1 голос
/ 20 мая 2009

Регулярные выражения в принципе плохо разбирают HTML (см. . Можете ли вы привести некоторые примеры того, почему трудно анализировать XML и HTML с регулярным выражением? , почему). К счастью, у вас должен быть доступ к лучшему доступному парсеру: веб-браузеру. Современные браузеры создают объектную модель документа , которая представляет собой древовидную структуру, которая содержит всю информацию о странице. Одним из методов, которые вы можете вызвать в DOM, являются ссылки. Я действительно не знаю vbscript, но этот код выглядит так, как будто он должен работать:

For i = 0 To document.links.length
  document.write(document.links(i).href & "<BR>")
Next
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...