Как мы можем получить новые данные загрузки на другом сайте в asp.net mvc - PullRequest
0 голосов
/ 23 июня 2018

Я занимаюсь разработкой веб-программного обеспечения на asp.net MVC. Я хочу получить информацию, которая предоставляется на разных веб-сайтах, например, адреса электронной почты, которые являются адресами электронной почты разных компаний ... тогда помогите мне, как я могу получить информацию, которая недавно загружается на разныесайты ..

1 Ответ

0 голосов
/ 01 июля 2018

Просто подумайте, что вы хотите получить данные с www.example.com. Сначала вы должны прочитать весь HTML-код на этом сайте в виде строки, а затем отфильтровать нужные данные. Вы можете использовать веб-клиент, так как он прост в использовании.

Следующий код может вам помочь.

using (var client = new WebClient())
{
    string result = client.DownloadString("http://www.example.com");   
}

Теперь у вас есть весь HTML-код в виде строки. Вы можете отфильтровать из этой строки.

private void GetEmails(string result)
{
    //regular expression 
    string pattern = @"(([\w-]+\.)+[\w-]+|([a-zA-Z]{1}|[\w-]{2,}))@" + @"((([0-1]?[0-9]{1,2}|25[0-5]|2[0-4][0-9])\.([0-1]?[0-9]{1,2}|25[0-5]|2[0-4][0-9])\." + @"([0-1]?[0-9]{1,2}|25[0-5]|2[0-4][0-9])\.([0-1]?[0-9]{1,2}|25[0-5]|2[0-4][0-9])){1}|"+ @"([a-zA-Z]+[\w-]+\.)+[a-zA-Z]{2,4})";

    //Set up regex object 
    Regex RegExpr = new Regex(pattern, RegexOptions.IgnoreCase);

    //get the first match 
    Match match = RegExpr.Match(content);

    //loop through matches 
    while (match.Success)
    {
        //here you got the email.
        string email = match.Groups[0].Value;

        //get next match 
        match = match.NextMatch();
    }
} 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...