чтение текстового файла в c # - PullRequest
1 голос
/ 27 ноября 2009

У меня есть текстовый файл, его содержимое из почтового сообщения body.it включает html коды.

Я хочу взять только теги href из этого текстового файла. Я хочу сделать это с помощью веб-приложения asp.net c #.

Есть ли у кого-нибудь код, чтобы помочь мне ...

Спасибо

Ответы [ 2 ]

8 голосов
/ 27 ноября 2009

Попробуйте использовать Html Agility Pack , чтобы проанализировать HTML-код из вашей электронной почты и извлечь атрибуты href из тегов.

HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(emailBody);
foreach (HtmlNode link in doc.DocumentNode.SelectNodes("//a[@href]"))
{
   HtmlAttribute att = link.Attributes["href"];
   string href = att.Value;
}
1 голос
/ 27 ноября 2009

Вы можете использовать регулярные выражения, даже если это не идеальное решение:

class Program
{
    static void Main(string[] args)
    {
        var text = File.ReadAllText(@"d:\test.htm");

        Regex regex = new Regex("href\\s*=\\s*\"([^\"]*)\"", RegexOptions.IgnoreCase);
        MatchCollection matches = regex.Matches(text);
        foreach(Match match in matches)
        {
            Console.WriteLine(match.Groups[1]);
        }
    }
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...