проблемы кодирования с контентом в ответе HttpWebRequest - PullRequest
2 голосов
/ 24 мая 2011

Я использую HttpWebRequest для чтения на веб-странице, используя следующий код:

 var pageurl = new Uri(url, UriKind.Absolute);

        var request = (HttpWebRequest)WebRequest.Create(pageurl);
        request.Method = "GET";
        request.AutomaticDecompression = DecompressionMethods.GZip;
        request.KeepAlive = false;
        request.ConnectionGroupName = Guid.NewGuid().ToString();
        request.ServicePoint.Expect100Continue = false;
        request.Pipelined = false;
        request.MaximumResponseHeadersLength = 4;

        if (ignoreCertificateErrors)
        {
            ServicePointManager.ServerCertificateValidationCallback += AcceptAllCertificatePolicy;
        }

        var response = (HttpWebResponse)request.GetResponse();


    if (response != null)
        {
            using (var reader = new StreamReader(response.GetResponseStream()))
            {
                return reader.ReadToEnd();
            }
        }

Это прекрасно работает, когда передается язык английский, но когда другой язык, например испанский, я получаю множество �в возвращаемом контенте.

Есть ли проблема с кодом или есть какая-то кодировка, если мне не хватает?

1 Ответ

5 голосов
/ 24 мая 2011

Вы должны указать правильную кодировку для страницы, которую вы загружаете в StreamReader.Например, если страница находится в кодировке ISO-8859-2, используйте

new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("ISO-8859-2"))
...