Как прочитать html вне спа-сайта с asp. net .core - PullRequest
0 голосов
/ 25 марта 2020

Поскольку для этого нет API, мне нужно получить HTML следующего веб-сайта с методом ответа WebClient.

HttpClient client = new HttpClient();
try
{
    HttpResponseMessage response = await client.GetAsync("https://www.datawrapper.de/_/UPFwh/");
    response.EnsureSuccessStatusCode();
    string responseBody = await response.Content.ReadAsStringAsync();
}
catch(HttpRequestException e)
{
}

client.Dispose(true);

Проблема в том, что когда я это делаю, я получаю только исходный код обычных javascript-кодов этого одностраничного приложения, а не настоящих HTML.

Кто-нибудь знает, как получить настоящий html с помощью

1 Ответ

0 голосов
/ 25 марта 2020

Я немного профилировал траффи c, и похоже, что ответ от того URL, который вы используете, действительно в основном скрипт, который в конечном итоге загрузит остальную часть сайта. Просматривая детали, часть основных данных HTML представляется доступной по другому URL-адресу:

https://datawrapper.dwcdn.net/UPFwh/34/

Попробуйте использовать это вместо этого. Надеюсь, это поможет!

...