Обнаружение кодировки HttpWebResponse - PullRequest
1 голос
/ 18 марта 2010

В последнее время я использую HttpWebRequest / HttpWebResponse, и у меня возникают проблемы с кодированием. HttpWebResponse.CharacterSet не всегда представляет реальную кодировку страницы, поэтому я подумал, что могу использовать метатег Content-Type.

  1. Как я могу прочитать метатег Content-Type, если я даже не могу декодировать ответ (в случае неправильного http-заголовка CharacterSet)?
  2. Существует ли решение с открытым исходным кодом, которое будет автоматически работать с кодировкой страницы и способно загружать источник URL-адреса, как браузер?

Обратите внимание, что мне не требуются такие причудливые методы, как алгоритмы обнаружения наборов символов, просто базовые вещи, такие как обнаружение на основе заголовка http или элементов мета-тегов.

Заранее спасибо.

1 Ответ

2 голосов
/ 18 марта 2010

Я использовал это решение. Это работает.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...