Python BeautifulSoup - найти конкретную <li>в - PullRequest
0 голосов
/ 23 октября 2018

Я пытаюсь извлечь "li" из следующего HTML:

enter image description here

Я пробовал это так:

soup = BeautifulSoup(html, 'html.parser')
containers = soup.find('div', {'class': 'pagination-container'}).find('ul')`
containers.li

но я не получаю ожидаемого результата.кто-нибудь может мне помочь?

1 Ответ

0 голосов
/ 23 октября 2018
soup.find_all('li')[0]

для поиска всех li на вашей странице, 0 для индексации.

soup.find_all('span', class_='ad')

поиск диапазона с классом ad

мой диапазон содержал много данных других диапазонов иот которого я хотел избавиться, и я знал, что ищу это конкретное слово между и

Artist = soup.find_all('h1')[0]
Artist = re.search('<h1>(.*)<span', str(Artist))
Artist = Artist.group(0)
Artist = str(Artist).replace('<h1>','')
Artist = str(Artist).replace('<span','')

Я не придумал ничего лучшего, но это сработало. Я буду рад рекомендации:)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...