Очистить ссылки с сайта - не вижу ссылки - PullRequest
1 голос
/ 25 января 2012

Я хочу почистить некоторые таблицы средней арендной платы за жилье в Веллингтоне, Новая Зеландия. Для каждого пригорода Веллингтона есть отдельные таблицы, каждая из которых находится на отдельной странице. У меня проблема с поиском адреса для каждой из этих страниц, чтобы я мог почистить таблицы.

Вот ссылка на веб-сайт, над которым я работаю http://www.dbh.govt.nz/market-rent?TLA=Wellington&RegionId=9. Чтобы найти ссылки для страниц пригорода, я использовал опцию просмотра страницы источника в Google Chrome. Однако, несмотря на то, что он может щелкнуть по каждому пригороду, чтобы увидеть таблицу арендных ставок, html, похоже, не содержит ссылок; нет href.

Может кто-нибудь объяснить, как эти ссылки без HREF? Кроме того, кто-нибудь знает способ найти ссылки для каждой таблицы пригородов? В конечном итоге я хочу использовать итерацию по списку URL-адресов пригородов и использовать модуль BeautifulSoup в python для извлечения таблиц арендной платы.

С уважением, Alex

1 Ответ

1 голос
/ 25 января 2012

Вы правы, они не являются "ссылками", и в этом смысле в них нет поля href. Каждая "ссылка" на самом деле является элементом <input> типа submit. Довольно интересный (и нестандартный) способ ведения дел!

Вот несколько мест, где можно узнать больше о HTML-формах:

Вы сможете создать полный http-запрос для каждой таблицы пригородов, сославшись на родительский элемент <form>, который будет содержать URL-адрес и метод отправки (POST или GET), а также определив параметры запроса. за каждую «ссылку» из соответствующего <input> элемента.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...