Google colab: доступ запрещен У вас нет прав доступа к «сайту» на этом сервере - PullRequest
0 голосов
/ 08 декабря 2018

Я пытаюсь почистить сайт на Google Colab, используя красивый суп.Я могу очистить содержимое на своем локальном компьютере, но когда я пытаюсь очистить его в облаке.Я получаю сообщение об ошибке.

'\ nДоступ запрещен \ n \ nДоступ запрещен \ n \ nУ вас нет прав доступа "http://www.justdial.com/Bangalore/Spardha-Mithra-IAS-KAS-Coaching-Centre-Opposite-Maruthi-Medicals-Vijayanagar/080PXX80-XX80-140120184741-R6P8_BZDET?" на этом сервере. \ NСсылка #18.740f1160.1544263996.61a6bb6e \ n \ n \ n '

Когда я запускаю тот же код на моей локальной машине, он отлично работает.

import requests
import re
from bs4 import BeautifulSoup
url = 'https://www.justdial.com/Bangalore/Spardha-Mithra-IAS-KAS-Coaching-Centre-Opposite-Maruthi-Medicals-Vijayanagar/080PXX80-XX80-140120184741-R6P8_BZDET?xid=QmFuZ2Fsb3JlIEJhbmsgRXhhbSBUdXRvcmlhbHM='
res  = requests.get(url, headers  = {'User-Agent': 'Mozilla/5.0'})
soup = BeautifulSoup(res.content, 'html.parser')
print(res)

Вывод:

<Response [403]>

Почему это происходит и есть ли способ от него избавиться.

1 Ответ

0 голосов
/ 08 декабря 2018

Уверен, это ограничение скорости на стороне сервера.Ваш код отлично работает для меня в колабе.Вы можете попробовать функцию Colab «Сбросить все среды выполнения», чтобы получить новую виртуальную машину, чтобы исключить любые побочные эффекты от другого кода ноутбука, который вы запускали.

...