Невозможно открыть URL с запросами - PullRequest
0 голосов
/ 05 февраля 2020

Я получаю HTTPError: 400 для приведенного ниже кода, я не понимаю, почему я не могу открыть URL

from bs4 import BeautifulSoup
import requests
import lxml
import pandas as pd
import re
search_url = f'https://www.booking.com/reviewlist.en-gb.html?aid=304142&label=gen173nr-1DCAsoAkIbY2VudHJvLXlhcy1pc2xhbmQtYWJ1LWRoYWJpSDNYBGhsiAEBmAEJuAEGyAEM2AED6AEBiAIBqAIDuAKEwOrxBcACAQ&sid=61a721d17d76bc82ccf82c3c3d92de7c&cc1=ae&dist=1&pagename=centro-yas-island-abu-dhabi&srpvid=fee14d92dc160043&type=total&rows=10&offset=0'

page = requests.get(search_url)
print(page)
if page.status_code == requests.codes.ok:
    soup = BeautifulSoup(page.text, 'lxml')
#    get_property_attributes(soup)
else:
    print('open error')

```

```
ouput : <Response [400]>

```
please any one give me some suggestions to overcome the issue

1 Ответ

0 голосов
/ 05 февраля 2020

Попробуйте добавить в запрос параметр заголовков:

from bs4 import BeautifulSoup
import requests
import lxml
import pandas as pd
import re
search_url = 'https://www.booking.com/reviewlist.en-gb.html?aid=304142&label=gen173nr-1DCAsoAkIbY2VudHJvLXlhcy1pc2xhbmQtYWJ1LWRoYWJpSDNYBGhsiAEBmAEJuAEGyAEM2AED6AEBiAIBqAIDuAKEwOrxBcACAQ&sid=61a721d17d76bc82ccf82c3c3d92de7c&cc1=ae&dist=1&pagename=centro-yas-island-abu-dhabi&srpvid=fee14d92dc160043&type=total&rows=10&offset=0'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36'}

page = requests.get(search_url, headers=headers)
print(page)
if page.status_code == requests.codes.ok:
    soup = BeautifulSoup(page.text, 'lxml')
#    get_property_attributes(soup)
else:
    print('open error')

Вывод:

<Response [200]>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...