Исключение при получении HTML с URL - PullRequest
0 голосов
/ 28 мая 2020

Я пытаюсь получить HTML из URL-адреса, чтобы сократить его с помощью Boilerpipe. Однако я продолжаю получать исключения. Я использую NewsAPI для получения своих URL-адресов. Вот соответствующий фрагмент кода:

foreach (var article in articlesResponse.Articles)
{
    string html;
    string url = article.Url;

    using (WebClient client = new WebClient())
    {
        html = client.DownloadString(url);
    }

    string text = CommonExtractors.DefaultExtractor.GetText(html);
    System.IO.File.AppendAllText(fileName, "Title: " + article.Title + "\n");
    System.IO.File.AppendAllText(fileName, "Author: " + article.Author + "\n");
    System.IO.File.AppendAllText(fileName, "Description: " + article.Description + "\n");
    System.IO.File.AppendAllText(fileName, "URL: " + article.Url + "\n");
    System.IO.File.AppendAllText(fileName, "Published at: " + article.PublishedAt + "\n");
    System.IO.File.AppendAllText(fileName, "Text: " + text + "\n\n");
}

И это детали из исключения:

System.Net.WebException
  HResult=0x80131509
  Message=The remote server returned an error: (404) Not Found.
  Source=System
  StackTrace:
   at System.Net.WebClient.DownloadDataInternal(Uri address, WebRequest& request)
   at System.Net.WebClient.DownloadString(Uri address)
   at System.Net.WebClient.DownloadString(String address)
   at newsapi_take_two.Program.Main(String[] args) in ...\source\repos\newsapi console\newsapi take two\Program.cs:line 53
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...