Не могу очистить результаты поиска Google с помощью beautifulsoup - PullRequest
1 голос
/ 19 июня 2020

Я хочу очистить результаты поиска Google, но всякий раз, когда я пытаюсь это сделать, программа возвращает пустой список

from bs4 import BeautifulSoup
import requests

keyWord = input("Input Your KeyWord :")

url = f'https://www.google.com/search?q={keyWord}'
src = requests.get(url).text
soup = BeautifulSoup(src, 'lxml')

container = soup.findAll('div', class_='g')

print(container)

1 Ответ

0 голосов
/ 19 июня 2020

Чтобы получить правильную страницу результатов из Google, укажите User-Agent http-заголовок. Только для engli sh результатов введите параметр hl=en в URL:

from bs4 import BeautifulSoup
import requests

keyWord = input("Input Your KeyWord :")

url = f'https://www.google.com/search?hl=en&q={keyWord}'
headers = {'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:77.0) Gecko/20100101 Firefox/77.0'}

src = requests.get(url, headers=headers).text
soup = BeautifulSoup(src, 'lxml')

containers = soup.findAll('div', class_='g')

for c in containers:
    print(c.get_text(strip=True, separator=' '))
...