Как мне отсортировать элементы списка в html, которые вычеркнуты из Beautifulsoup? - PullRequest
0 голосов
/ 20 декабря 2018

Я пытаюсь очистить данные html и успешно нашел данные, которые я пытаюсь получить.Проблема заключается в том, что я пытаюсь удалить элементы li, у которых нет класса или идентификатора, чтобы найти их среди нескольких других на странице, поэтому я нашел элемент ul, под которым они находятся, из его класса.Итак, у меня есть ul с элементами li, которые мне нужно сохранить в записи имени переменной, но когда я печатаю record.li.text, я получаю только первый элемент li и не понимаю, как получить другие элементы li в ul.Любая помощь приветствуется

soup = BeautifulSoup(response.content, "html.parser")
record = soup.find("ul", class_="ClubhouseHeader__Record")
print(record)

имеет вывод

<ul class="ClubhouseHeader__Record"><li>64-98</li><li>3rd in AL Cent</li></ul>

, а

soup = BeautifulSoup(response.content, "html.parser")
record = soup.find("ul", class_="ClubhouseHeader__Record").li.text
print(record)

имеет вывод

64-98

Я хотел бывывод будет

64-98
3rd in AL Cent

Любая помощь приветствуется!

Ответы [ 2 ]

0 голосов
/ 20 декабря 2018

Вы можете выбрать нужные элементы li за один раз с помощью CSS-селектора :

for li in soup.select("ul.ClubhouseHeader__Record li"):
    print(li.get_text(strip=True))
0 голосов
/ 20 декабря 2018

Вы рядом.Просто используйте BeautifulSoup.find_all:

r = [i.text for i in soup.find("ul", class_="ClubhouseHeader__Record").find_all('li')]

Вывод:

['64-98', '3rd in AL Cent']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...