Получение и анализ данных из mywebsearch (поисковая система) - PullRequest
0 голосов
/ 15 сентября 2018

Я пытался создать инструмент, который позволял бы мне вводить ключевое слово, и он автоматически делал это:

int.search.mywebsearch.com/mywebsearch/GGweb.jhtml?searchfor=Keyword

Затем очистите все URL-адреса на странице.

Однако, когда я перехожу к regexxr или regex101, кажется, что URL-адресов нет, и я не могу использовать регулярное выражение, чтобы получить его. Как я могу очистить то, что не может быть загружено с помощью WebClient.downloadstring(url)?

Код:

WebClient wc = new WebClient();
foreach(string s in Keywords)
{
    string url = wc.DownloadString("https://int.search.mywebsearch.com/mywebsearch/GGmain.jhtml?&searchfor=" + s);
    MatchCollection mc = Regex.Matches(url, @""); // Didn't write any regex yet
}

1 Ответ

0 голосов
/ 15 сентября 2018

Используйте это регулярное выражение:

<a[^>]+href\s?=\s?"([^"]+)"[^>]?>

Рабочая ДЕМО

...