Похоже, что веб-сайт отправляет запрос POST на getnewslistinfo.jsp
и возвращает новое содержимое таблицы как html. Вы можете открыть свою сеть (Ctrl + Shift + E на Firefox), затем перейти на следующую страницу и увидеть сделанный запрос и его параметры.
Вы можете имитировать этот запрос POST и изменить соответствующие параметры для следующей страницы (из того, что я видел, это должно быть nextValue
и doDirect
), используя urllib2 (или предпочтительно запросы ). После того, как вы получите контент, вы можете просто проанализировать его с помощью BeautifulSoup и извлечь теги a, как вы это уже сделали. * который с заданным номером страницы возвращает содержимое html, getLinks(html)
который с учетом html страницы получает все ссылки из таблицы и возвращает их в виде списка. Таким образом, ваш код будет более читаемым, и его будет проще отлаживать и использовать.