Скачивание по ссылкам в RSS-ленте - PullRequest
0 голосов
/ 28 мая 2010

Я пытаюсь создать каталог с новостными статьями, собранными из RSS-канала. Это означает, что когда бы ни была ссылка на статью в RSS-канале, я бы хотел, чтобы она была загружена в каталог с названием конкретная статья в виде имени файла как текстового файла. Это то, что Python может помочь мне сделать?

Спасибо за вашу помощь: -)

Ответы [ 2 ]

2 голосов
/ 28 мая 2010

Вы можете анализировать RSS-каналы с помощью feedparser и загружать файлы с помощью urllib2 . Если вам нужно разобрать HTML, используйте BeautifulSoup . Если у вас есть какие-либо проблемы с ними, опишите более конкретные вопросы.

1 голос
/ 28 мая 2010

Конечно. BeautifulSoup, lxml, urllib2, urlgrabber.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...