Экран скрап на электронную почту с полным URL для изображений и CSS - PullRequest
0 голосов
/ 09 августа 2011

Я сканирую веб-страницу и отправляю ее в виде html-письма.

Какой самый простой / лучший способ манипулировать html для установки полных http-адресов для всех изображений и файлов CSS?

Текущий метод похож на (введенный вручную) + он очень открыт для ошибок.

string html = rawHtml.replace("=\"", "=\"" + Request["SERVER_NAME"]);

.
.

Вот текущая функция, которую мы используем для скрининга экрана, используяПОЛУЧИТЬ

public static string WebGet(string address)
{
    string result = "";
    using (WebClient client = new WebClient())
    {
        using (StreamReader reader = new StreamReader(client.OpenRead(address)))
        {
            string s = reader.ReadToEnd();
            result = s;
        }
    }

    return result;
}

1 Ответ

1 голос
/ 09 августа 2011

Похоже, вам нужен HTML-парсер. После того, как вы проанализируете строку html с анализатором, вы сможете выполнять команды, которые легко манипулируют DOM, и, таким образом, вы можете найти все элементы img, проверить их src и добавить Запрос ["SERVER_NAME"], если вам нужно.

Я не кодирую в ASP, но я нашел это:

http://htmlagilitypack.codeplex.com/

А вот полезная статья, в которой я нашел объяснение, как ее использовать:

http://www.4guysfromrolla.com/articles/011211-1.aspx

...