Я получил html-источник по requests
и хочу разобрать их как удар (код sudo):
import requests
from bs4 import BeautifulSoup
response = requests.get('https://www.example.com', headers=headers, params=params)
html_doc = response.text
soup = BeautifulSoup(html_doc, 'html.parser')
item_ls = []
for elem in soup.select('.items'):
item_ls.append(elem.text)
Но я не уверен, что BeutifulSoup
obj. запрашивает данные, каждый раз, когда я повторяю элементы на for loop
(особенно при выполнении elem.text
), или я могу использовать obj. как локальный источник HTML, в отличие от selenium
.
Мне нужно минимизировать количество запросов, чтобы избежать блокировки.