Получить сгенерированный html с веб-страницы - PullRequest
0 голосов
/ 28 февраля 2020

Я пытаюсь почистить веб-страницы. Но на экране есть информация, которую я не могу найти в исходном коде. Однако, если я вручную сохраню веб-страницу как локальный файл, я получу сгенерированную страти c страницу. Могу ли я сделать это в C#?

Приведенный ниже код дает мне только источник веб-страницы, но не интересующие меня значения.

WebClient client = new WebClient();
string sPageHtml = null;
string sUrl = @"http://www.nasdaqomxnordic.com/bonds/denmark/microsite?Instrument=XCSE0%3A5RD27SSA50";

sPageHtml = client.DownloadString(sUrl);

1 Ответ

0 голосов
/ 03 марта 2020

Я предлагаю вам использовать специальный инструмент, такой как HtmlAgilityPack Пакет Nuget:

Описание пакета: это синтаксический анализатор agile HTML, который создает чтение / запись DOM и поддерживает простой XPATH или XSLT (вам на самом деле не нужно понимать XPATH или XSLT, чтобы его использовать, не беспокойтесь ...). Это библиотека кодов. NET, которая позволяет вам анализировать файлы HTML "из Интернета". Парсер очень терпим с "реальным миром", искаженным HTML. Объектная модель очень похожа на ту, что предлагает System. Xml, но для HTML документов (или потоков).

Полагаю, вам будет проще получить то, что вам интересно в.

...