WebClient показывает странные символы - PullRequest
0 голосов
/ 05 февраля 2012

Я пытаюсь скачать этот сайт: http://tnid.us/lookup/5705544911/

И отфильтруйте данные, чтобы получить «Оригинальную телефонную компанию», и т. Д., Но они показывают эти данные вместо того, что они должны показывать:

 <p class="lt">Estimated Region:<br /><strong>&#80;&#101;&#110;&#110;&#115;&#121;&#108;&#118;&#97;&#110;&#105;&#97;</strong>

Вместо:

Предполагаемый регион:
Пенсильвания

Есть ли способ исправить / преобразовать его в .NET?

Ответы [ 2 ]

1 голос
/ 06 февраля 2012

Данные, которые вы видите, являются HTML-строкой значений ascii.

Я не знаю точно, но WebUtility.HtmlDecode может сработать.

Если выяснится, что декодированный контент содержит разметку ascii, вы можете использовать WebUtility.HtmlEncode только те части разметки, которые представлены символами ascii.

1 голос
/ 05 февраля 2012

Это HTML .

Вы ищете HTML-пакет Agility Pack .

...