Как читать URL, начиная с view-source в C # - PullRequest
0 голосов
/ 09 сентября 2018

Я хочу прочитать следующий URL, и он должен сохранить содержимое, доступное на странице, в текстовый файл.

Я использую приведенный ниже код для чтения источника страницы:

string address = "view-source:http://stackoverflow.com/";  //any web site url

using (WebClient wc = new WebClient())
{
    var Text= wc.DownloadString(address);            
}

Но этоисключение «Префикс URI не распознан».

Любая помощь будет признательна.

Спасибо!заранее.

1 Ответ

0 голосов
/ 09 сентября 2018

Вы используете функцию Chrome, добавляя "view-source:" к этому URL. Класс WebClient, вероятно, ничего не знает об этой функции. Он жалуется на то, что «префикс URI» не распознается. Это "view-source:" часть вашей строки.

Итак, удалите эту часть URL, и у вас будет действительный URL.

string userInput = "view-source:http://stackoverflow.com/";
string address = userInput.Replace("view-source:", "");    

Примечание. Это может привести к различным результатам для веб-приложений, которые предоставляют дополнительный контент после запуска и интерпретации JavaScript. В конечном итоге вы можете не получить то, что хотите.

Редактировать: после вашего комментария звучит так, будто вы хотите удалить возможность URL, начинающегося с "view-source:", который я отразил в ответе.

На всякий случай, если вы ищете источник "post javascript". На github есть проект , который предлагает эту функцию, но я никогда не использовал ее. Я знаю об этом только потому, что он поддерживается парнем, с которым я работаю.

Вы также можете найти рабочий пример в этом ответе

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...