В последнее время я использую HttpWebRequest / HttpWebResponse, и у меня возникают проблемы с кодированием.
HttpWebResponse.CharacterSet не всегда представляет реальную кодировку страницы, поэтому я подумал, что могу использовать метатег Content-Type.
- Как я могу прочитать метатег Content-Type, если я даже не могу декодировать ответ (в случае неправильного http-заголовка CharacterSet)?
- Существует ли решение с открытым исходным кодом, которое будет автоматически работать с кодировкой страницы и способно загружать источник URL-адреса, как браузер?
Обратите внимание, что мне не требуются такие причудливые методы, как алгоритмы обнаружения наборов символов, просто базовые вещи, такие как обнаружение на основе заголовка http или элементов мета-тегов.
Заранее спасибо.