Как просмотреть текущий URL с помощью твилла? - PullRequest
2 голосов
/ 13 марта 2012

Я намерен использовать twill для заполнения формы на одной странице, нажать кнопку «Отправить», а затем использовать BeautifulSoup для анализа полученной страницы. Как я могу кормить BeautifulSoup HTML-страницы? Я предполагаю, что должен прочитать текущий URL, но я не знаю, как на самом деле вернуть URL, чтобы сделать это. Я попробовал TwillBrowser.get_url (), но он возвращает только None.

Ответы [ 2 ]

0 голосов
/ 14 марта 2014

Наконец-то понял это!

Если вы импортируете саржу, например, так:

import twill.commands as com

, тогда url =

url = com.browser.get_url()

Источник: http://nullege.com/codes/search/twill.commands.browser.get_url?utm_expid=24446124-0.lSQi4Ea5S7WZwxHvFPbOIA.0&utm_referrer=https%3A%2F%2Fwww.google.com%2F

0 голосов
/ 13 марта 2012

Для любого будущего страдальца мне больше повезло с использованием механизации вместо саржи, так как саржа - это необновленная тонкая оболочка для механизации.Решение заключается в следующем:

import mechanize

url = "foo.com"
br = mechanize.Browser()

br.open(url)

br.select_form(name = "YOURFORMNAMEHERE") #make sure to leave the quotation marks
br["YOURINPUTFIELDNAMEHERE"] = ["YOURVALUEHERE"] #this must be in a list even if it is only one value

response = br.submit()

print response.geturl()
...