Как найти все элементы определенного типа с новой библиотекой Requests-HTML - PullRequest
0 голосов
/ 25 октября 2018

Я хочу найти все определенные поля в HTML, в Beautiful soup все работает с этим кодом:

soup = BeautifulSoup(html_text, 'html.parser')
urls_previous = soup.find_all('h2', {'class': 'b_algo'})

, но как я могу сделать тот же поиск с библиотекой запросов, или запросы могут найти толькоодин элемент в документе HTML, я не мог найти, как это сделать в документах или примерах?

https://html.python -requests.org /

Пример:

<li class="b_algo"><h2><a href="https://de.wikipedia.org/wiki/Vereinigte_Staaten">Vereinigte Staaten – Wikipedia</a></h2><a href="https://de.wikipedia.org/wiki/Vereinigte_Staaten">https://de.wikipedia.org/wiki/Vereinigte_Staaten</a></div><p>U.S., I wanna have THIS text here</p></li>

Как найти все элементы определенного типа в библиотеке запросов?

1 Ответ

0 голосов
/ 07 ноября 2018

с html-запросами

from requests_html import HTML
doc = """<li class="b_algo"><h2><a href="https://de.wikipedia.org/wiki/Vereinigte_Staaten">Vereinigte Staaten – Wikipedia</a></h2><a href="https://de.wikipedia.org/wiki/Vereinigte_Staaten">https://de.wikipedia.org/wiki/Vereinigte_Staaten</a></div><p>U.S., I wanna have THIS text here</p></li>"""
#load html from string
html = HTML(html=doc)
x = html.find('h2')
print(x)
...