Не удается преобразовать тип 'string' в 'HtmlAgilityPack.HtmlDocument'? - PullRequest
3 голосов
/ 11 июня 2010
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Net;
using HtmlAgilityPack;

namespace sss
{
    public class Downloader
    {
        WebClient client = new WebClient();

        public HtmlDocument FindMovie(string Title)
        { 
            //This will be implemented later on, it will search movie.
        }

        public HtmlDocument FindKnownMovie(string ID)
        {
            HtmlDocument Page = (HtmlDocument)client.DownloadString(String.Format("http://www.imdb.com/title/{0}/", ID));
        }
    }
}

Как преобразовать загруженную строку в действительный HtmlDocument, чтобы я мог ее проанализировать с помощью HTMLAgilityPack?

Ответы [ 4 ]

6 голосов
/ 11 июня 2010

Это должно работать с v1.4:

HtmlWeb hw = new HtmlWeb();
HtmlDocument doc = hw.Load(string.Format("http://www.imdb.com/title/{0}/", ID));

или

string html = client.DownloadString(String.Format("http://www.imdb.com/title/{0}/", ID));
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);
4 голосов
/ 11 июня 2010

Попробуйте (на основе этого довольно старого документа ):

string url = String.Format("http://www.imdb.com/title/{0}/", ID);
string content = client.DownloadString(url);
HtmlDocument page = new HtmlDocument();
page.LoadHtml(content);

По сути, редко является правильным способом преобразования между двумя типами - особенно когда происходит что-то вроде парсинга.

1 голос
/ 11 июня 2010

Следующие строки кода создадут HtmlDocument с вашим контентом:

// First create a blank document
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
// Then load it with the content from the webpage you are trying to parse
doc.Load(new StreamReader(WebRequest.Create("yourURL").GetResponse()
                                 .GetResponseStream()));
0 голосов
/ 11 июня 2010

Возможно, вы могли бы создать новый файл (.html) для файловой системы, а затем использовать потоковую запись для записи строки в html-файл.Затем передайте этот файл парсеру

...