Не могу получить правильное функционирование заголовка (ошибка 403) - PullRequest
0 голосов
/ 06 апреля 2019

Я следую инструкциям на YouTube, но застрял при поиске правильного User-Agent, чтобы пройти HTTP 403 Forbidden

Вот код, который я пытаюсь использовать:

from bs4 import BeautifulSoup as soup
from urllib.request import urlopen as uReq

user_agent = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7'

my_url = "https://www.pedidosya.com.ar/restaurantes/buenos-aires/monserrat/empanadas-delivery"
headers = {'User-Agent':user_agent,} 

uReq(my_url)

1 Ответ

1 голос
/ 06 апреля 2019

Возможно, это проблема отсутствия поддержки сеанса на сервере, который хранит данные, такие как куки?Я столкнулся с проблемой истечения времени переадресации, и решение было использовать requests.session().Мой код в итоге выглядел примерно так:

import bs4
import requests

s = requests.session()
s.headers['User-Agent'] = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.131 Safari/537.36'
res = s.get('https://www.pedidosya.com.ar/restaurantes/buenos-aires/monserrat/empanadas-delivery')
soup = bs4.BeautifulSoup(res.text, 'html.parser')

Когда я запускаю это, не возникает ошибки.

Пользователь-агент, которого я только что нашел в сообщении онлайн.Я понятия не имею, как это действительно работает, но это заставляет мои сценарии работать, поэтому мне не нужно понимать XD

...