Как я могу автоматизировать поиск изображений, видео или других файлов на странице (например, анализатор менеджера загрузок Chrono) и загружать их, используя python? - PullRequest
0 голосов
/ 11 апреля 2020

Как мне автоматизировать поиск изображений, видео или других файлов на странице (аналогично диспетчеру загрузок Chrono) и загружать их с помощью python? Я хотел бы загрузить различные изображения, видео и другие файлы, такие как pdf, с нескольких веб-страниц, я делал это вручную, страницу за страницей, используя менеджер загрузок Chrono, так как я обнаружил, что он очень хорош для идентификации всех файлов (особенно видео, которые многие другие загрузчики не распознают), но я хотел бы автоматизировать процесс, если это возможно.

Я хотел бы иметь возможность загружать URL-адреса и загружать файлы, сохранять их с помощью название темы, о которой страница, как имя файла, и, возможно, даже откройте ссылку на следующую подстраницу и загрузите файлы, прежде чем перейти к следующему URL-адресу, который я дал ему, то есть что-то вроде: 1.0 - ссылка из Список 1.1 - Ссылка на следующую страницу 1.2 - Ссылка на следующую страницу 2.0 - Ссылка из списка 2.1 - Ссылка на следующую страницу 2.1 - Ссылка на следующую страницу

Я потратил много времени на просмотр статей о веб-соскоб и пытается использовать такие вещи, как BeautifulSoup, запросы и selenium et c. чтобы попытаться извлечь прямые ссылки в файлах HTML и JavaScript на файлы, но я не могу найти способ сделать это сам и продолжаю заглядывать в тупик.

Любая помощь, которую вы можете дать будет с благодарностью.

...