Question

Я использую метод для получения html, иногда он работает и не может получить какие-либо данные, просто получить «Страница не найдена» (я могу войти в любой браузер). Я не знаю, если это система безопасности, чтобы избежать многократных запросов или что-то еще, веб-сайт: https://www.bcn.cat/estadistica/catala/dades/barris/economia/renda/rdfamiliar/a2017.htm

Кто-нибудь знает, как с этим бороться?

Метод:

response = requests.get(website, headers={
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_4) \
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.47 Safari/537.36',
'referer': 'http://habitatge.gencat.cat/'})

soup = BeautifulSoup(response.content, 'html.parser')

print soup

table = soup.find('table')

print table

Большое вам спасибо

M. Mariscal · Answer 1 · 13 февраля 2020

РЕШЕНИЕ

В конце проблема состояла в том, чтобы разбить на несколько строк «User-Agent»

Невозможно получить таблицу, используя BS4 Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Невозможно получить таблицу, используя BS4 Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы