Читайте номер страницы, просматривая сайт с помощью BeautifulSoup - PullRequest
0 голосов
/ 07 октября 2018

Я пытаюсь прочитать и вставить в переменную только номер страницы из URL-ссылки ... которую я удалил с веб-сайта.ниже вывод на печать переменной, которую я удалил с веб-сайта

<li><a href="https://bp.portwallet.com/report/topUp?source=gp_web&amp;allSearch=&amp;amountFrom=1&amp;amountTo=50000&amp;startdate=2018-10-03&amp;enddate=2018-10-03&amp;topUpSearch=topUpSearch&amp;status=1&amp;rType=Prepaid&amp;per_page=46">Last ›</a></li>

Мне нужно поместить значение per_page = в переменную.

Я пытался очистить только число, ноне повезло

1 Ответ

0 голосов
/ 07 октября 2018
from bs4 import BeautifulSoup
page = '''<li><a href="https://bp.portwallet.com/report/topUp?source=gp_web&amp;allSearch=&amp;amountFrom=1&amp;amountTo=50000&amp;startdate=2018-10-03&amp;enddate=2018-10-03&amp;topUpSearch=topUpSearch&amp;status=1&amp;rType=Prepaid&amp;per_page=46">Last ›</a></li>'''
soup = BeautifulSoup(page, 'html.parser')
x = soup.select('a')
per_page = (x[0]['href']).split('per_page=')[-1]
print('per_page:', per_page)

Выход:

per_page: 46
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...