Как я могу скачать файлы с веб-страниц? - PullRequest
0 голосов
/ 16 июля 2010

Некоторые веб-страницы, имеющие свои URL-адреса, имеют текст «Загрузить», который является гиперссылкой.

Как получить гиперссылки с URL-страниц или страниц с помощью python или ironpython.

Ия могу скачать файлы с этими гиперссылками через python или ironpython?Как я могу это сделать?

Существуют ли какие-либо инструменты C #?

Я не являюсь носителем английского языка, извините за мой английский.

Ответы [ 2 ]

2 голосов
/ 16 июля 2010

Вы можете использовать библиотеку BeautifulSoup с CPython (обычный Python) и IronPython.Проверьте метод findAll () .Это должно вытащить список всех ссылок.

soup.findAll('a')
1 голос
/ 16 июля 2010

Самый простой способ - передать страницу HTML в синтаксический анализатор XML / HTML, а затем вызвать getElementsByTagName("A") в корневом узле. Как только вы это получите, переберите список и извлеките параметр href.

...