Библиотека загрузчиков веб-сайтов - PullRequest
1 голос
/ 15 марта 2010

Мне нужно собрать небольшой проект для себя, и мне нужны некоторые функции для загрузки страницы для просмотра в автономном режиме. Существует ли библиотека, которая будет загружать данную страницу и встроенные изображения, а также редактировать теги img для отражения локального расположения изображений.

Я знаю, что есть много загрузчиков веб-сайтов, но я не могу найти то, что я могу использовать непосредственно в моем коде.

У меня есть несколько основных скриптов, написанных на python, поэтому Python очень приветствуется. но почти любой язык подойдет.

Ответы [ 4 ]

1 голос
/ 15 марта 2010

Как насчет python web crawler? http://code.google.com/p/pywebcrawler/

ИЛИ, Анемон (рубин)? http://anemone.rubyforge.org/

1 голос
/ 15 марта 2010

Да, BeautifulSoup + python urllib модуль

1 голос
/ 15 марта 2010

Вы ищете BeautifulSoup .

0 голосов
/ 01 декабря 2011

простейшее решение, которое я могу придумать.

wget -p example.com
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...