регулярное выражение C # - PullRequest
       6

регулярное выражение C #

2 голосов
/ 27 августа 2009

У меня есть html-страница со ссылкой типа /with_us.php?page=digit и out.php? I = digit. как я могу получить все эти ссылки со страницы, но будет лучше, если я смогу сразу собирать только цифры из этих ссылок

Ответы [ 2 ]

3 голосов
/ 27 августа 2009

HTML Agility Pack идеально подходит для этого; это почти так же, как пример на домашней странице:

foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href]")
{
    string href = link["href"].Value;
}

Теперь просто разберите "href"; возможно что-то вроде:

Match match = Regex.Match(href, @"[&?]\w+=(\d+)");
int i;
if (match.Success && int.TryParse(match.Groups[1].Value, out i))
{
    Console.WriteLine(i);
}
0 голосов
/ 27 августа 2009

Возможно, вы захотите попытаться действительно проанализировать страницу и пройти DOM.

Try: http://www.codeplex.com/htmlagilitypack

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...