Просто подумайте, что вы хотите получить данные с www.example.com. Сначала вы должны прочитать весь HTML-код на этом сайте в виде строки, а затем отфильтровать нужные данные. Вы можете использовать веб-клиент, так как он прост в использовании.
Следующий код может вам помочь.
using (var client = new WebClient())
{
string result = client.DownloadString("http://www.example.com");
}
Теперь у вас есть весь HTML-код в виде строки. Вы можете отфильтровать из этой строки.
private void GetEmails(string result)
{
//regular expression
string pattern = @"(([\w-]+\.)+[\w-]+|([a-zA-Z]{1}|[\w-]{2,}))@" + @"((([0-1]?[0-9]{1,2}|25[0-5]|2[0-4][0-9])\.([0-1]?[0-9]{1,2}|25[0-5]|2[0-4][0-9])\." + @"([0-1]?[0-9]{1,2}|25[0-5]|2[0-4][0-9])\.([0-1]?[0-9]{1,2}|25[0-5]|2[0-4][0-9])){1}|"+ @"([a-zA-Z]+[\w-]+\.)+[a-zA-Z]{2,4})";
//Set up regex object
Regex RegExpr = new Regex(pattern, RegexOptions.IgnoreCase);
//get the first match
Match match = RegExpr.Match(content);
//loop through matches
while (match.Success)
{
//here you got the email.
string email = match.Groups[0].Value;
//get next match
match = match.NextMatch();
}
}