У меня проблема с WebRequest
в C #. Это страница Google.
Состояния заголовка
text/html; charset=ISO-8859-1
На сайте указано
<meta http-equiv=content-type content="text/html; charset=utf-8">
И, наконец, я получаю только ожидаемый результат в отладчике, а также регулярное выражение, когда я использую Encoding.Default
, по умолчанию System.Text.SBCSCodePageEncoding
И что мне теперь делать? У вас есть какие-нибудь подсказки, как это могло произойти или как я мог решить эту проблему?
Фактическая кодировка страницы выглядит как UTF-8. По крайней мере, FF отображает его правильно в UTF-8, , а не в Windows-Wh независимо и не в латинице1.
URL-адрес это
Проблема в знаке €, как и во всех немецких умлаутах.
Заранее спасибо за помощь по этой проблеме, которая сводит меня с ума!
Обновление: когда я вывожу строку через
// create a writer and open the file
TextWriter tw = new StreamWriter("test.txt");
// write a line of text to the file
tw.WriteLine(html);
// close the stream
tw.Close();
все отлично работает.
Похоже, проблема в том, что отладчик не показывает правильную кодировку, а также регулярное выражение.
Как мне сказать C # обрабатывать RegEx как UTF-8?