for i in range(1,1000000): page = urllib2.urlopen("http://www.palgrave.com/products/title.aspx?pid="+str(i)) print "http://www.palgrave.com/products/title.aspx?pid="+str(i) soup = BeautifulSoup(page) #retreive books = soup.findAll("div",{"id":"Title"}) #process
Мне нужно пролистать весь каталог для издателя. Мне нужно получить:
используйте XPath для извлечения контента из этих мест