Веб-очистка Python, не могу нажать на следующую страницу - PullRequest
0 голосов
/ 03 февраля 2012

Я собираю данные со страницы, заполняя поля формы следующим образом:

url = 'http://www.theurl.co.uk/Enquiry.asp'

values = {'PageSize' : '20', 'SortField' : '1', 'SortOrder' : 'ASC'}

data = urllib.urlencode(values)          
req = urllib2.Request(url, data)
source = urllib2.urlopen(req)

soup = BeautifulSoup(source)

Тогда извлекаю мои данные из супа. Моя проблема в том, что мне нужно перейти к следующим 20 результатам, кнопка следующей страницы управляется следующей строкой в ​​источнике:

<input type="submit" name="Action" value=" > " style="font-family: Verdana; font-size: 8pt; color: #000080; font-weight: bold">

Как я могу это сделать, не переходя на использование механизации (которой я раньше не пользовался); это возможно?

Большое спасибо

1 Ответ

0 голосов
/ 03 февраля 2012

Ищите атрибут действия элементов формы. Если его нет, он будет использовать тот же URL. Я бы поспорил, что где-то в форме есть значение номера страницы, которое вам нужно будет использовать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...