Question

Мне нужно создать настольное приложение для Windows на C #, которое загружает все PDF-файлы с веб-сайта. У меня есть ссылка на веб-сайт, но проблема, с которой я сталкиваюсь, заключается в том, что файлы PDF не находятся в определенной папке на веб-сайте, а разбросаны по всему.

Мне нужна помощь в поиске всех этих ссылок, чтобы я мог загрузить их или любые другие советы, которые могут помочь мне с моей проблемой.

Спасибо всем за помощь в продвинутом.

lukas.pukenis · Answer 1 · 17 марта 2012

Пролистать все страницы
Найти все "* .pdf" URL
Восстановить их и просто скачать:)

Пожалуйста, будьтеболее конкретно вы пытаетесь получить все PDF-файлы со страницы HTML или со всего домена?

Sandeep Kumar · Answer 2 · 23 августа 2018

То, что вы пытаетесь сделать, известно как веб-очистка , есть несколько библиотек, которые могут упростить вашу задачу, одна из них - IronWebScraper , но платная.

Обширный список пакетов NuGet доступен здесь , которые можно использовать для очистки веб-страниц.

Загрузка всех файлов PDF с веб-сайта

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Загрузка всех файлов PDF с веб-сайта

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов