гибкость html парсера чтения из буфера / потока - PullRequest
2 голосов
/ 04 октября 2011

Я пытаюсь изменить страницу HTML, прежде чем она будет отображаться в браузере с использованием модуля HTTP.Я пытался реализовать анализатор HTML ловкости, но он, похоже, читает только из файлов.

Как мне прочитать его из буфера / потока?

public override void Write(byte[] buffer, int offset, int count)
    {
      byte[] data = new byte[count];
      Buffer.BlockCopy(buffer, offset, data, 0, count);
      string html = System.Text.Encoding.Default.GetString(buffer);

      HtmlDocument doc = new HtmlDocument();
      doc.Load(html);
      foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
      {
      HtmlAttribute att = link["href"];
      att.Value = FixLink(att);
      }
    }

Ответы [ 2 ]

1 голос
/ 04 октября 2011

Вы должны иметь возможность использовать MemoryStream для чтения данных:

public override void Write(byte[] buffer, int offset, int count)
{
  var stream = new MemoryStream(buffer, offset, count);

  HtmlDocument doc = new HtmlDocument();
  doc.Load(stream);

  foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
  {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
  }
}
1 голос
/ 04 октября 2011

На самом деле метод HtmlDocument.Load () перегружен и содержит определения для загрузки потоков: загрузка (поток), загрузка (поток, логическое значение), загрузка (поток, кодировка).

Документацию можно найти на вкладке «Загрузки» по адресу http://htmlagilitypack.codeplex.com/

...