Как извлечь HTML-код для веб-сайта, используя iframe и silverlight - PullRequest
1 голос
/ 15 июля 2010

Мне нужно загрузить определенную веб-страницу с сайта, на котором есть несколько изображений.Мне нужно извлечь эти изображения, но я не могу сделать это вручную, потому что имена каждого изображения не имеют шаблона, и будут сотни сайтов.У меня есть приложение silverlight для загрузки веб-страницы в iframe, и я намеревался извлечь html для этой веб-страницы, а затем извлечь источник изображения для каждого изображения из извлеченного кода и затем заполнить список.

Я могу загрузить веб-страницу в iframe без проблем, но я не знаю, как извлечь html-код для веб-страницы.

public Page()
    {
        InitializeComponent();

        System.Windows.Browser.HtmlElement myFrame = System.Windows.Browser.HtmlPage.Document.GetElementById("ifHtmlContent");
        if (myFrame != null)
        {
            myFrame.SetStyleAttribute("width", "1024");
            myFrame.SetStyleAttribute("height", "768");
            myFrame.SetAttribute("src", txtURI.Text);
            myFrame.SetStyleAttribute("left", "0");
            myFrame.SetStyleAttribute("top", "50");
            myFrame.SetStyleAttribute("visibility", "visible");            
        }
    }

    private void UserControl_Loaded(object sender, RoutedEventArgs e)
    {
        this.Button_Click(sender, e);
    }

    private void Button_Click(object sender, RoutedEventArgs e)
    {
        System.Windows.Browser.HtmlElement myFrame = System.Windows.Browser.HtmlPage.Document.GetElementById("ifHtmlContent");
        if (myFrame != null) myFrame.SetAttribute("src", txtURI.Text);
    }

    private void txtURI_KeyDown(object sender, KeyEventArgs e)
    {
        if (e.Key == Key.Enter)
            this.Button_Click(sender, e);
    }

1 Ответ

0 голосов
/ 15 июля 2010

Следующая статья может предложить некоторую помощь: http://jesseliberty.com/2010/05/03/screen-scraping-when-all-you-have-is-a-hammer/

...