Я изучаю C #, создав небольшую программу, и не смог найти похожий пост (извиняюсь, если этот ответ опубликован где-то в другом месте).
Как я могу заняться скринингом сайта дляссылки на PDF-файлы (которые я могу затем загрузить в указанное место)?Иногда страница будет иметь ссылку на другую HTML-страницу с фактической ссылкой PDF, поэтому, если фактический PDF не может быть найден на первой странице, я бы хотел, чтобы он автоматически искал ссылку с надписью «PDF» втекст ссылки, а затем найдите на этой HTML-странице настоящую ссылку PDF.
Я знаю, что мог бы достичь чего-то подобного с помощью поиска по типам файлов через Google, но мне это кажется "обманом" :) Я бы лучше научился делать это в коде, но я не уверенкогда начать.Я немного знаком с анализом XML с помощью XElement и тому подобного, но я не уверен, как это сделать для получения ссылок со страницы HTML (или другого формата?).
Может ли кто-нибудь указать мне правильное направление?Спасибо!