Почему я получаю пустой список после попытки очистить веб-страницу? - PullRequest
0 голосов
/ 22 сентября 2019

Я пытаюсь почистить адреса со следующего веб-сайта жилья: https://www.point2homes.com/CA/Real-Estate-Listings/ON/Brampton.html

Вот код, который я использовал

import requests
from bs4 import BeautifulSoup
import pandas as pd
import lxml




source=requests.get('https://www.point2homes.com/CA/Real-Estate-Listings/ON/Brampton.html')
soup=BeautifulSoup(source.text,'lxml')
match=soup.find_all('div',class_='address-container')
address=[]
for i in match:
    address.append(i.text)

Затем, когда я печатаю адрес, я получаюпустой список.Любая помощь будет высоко ценится.

1 Ответ

1 голос
/ 22 сентября 2019

Веб-сайт блокирует веб-страницу от ее удаления.

Он защищен этим CDN https://www.imperva.com/

Я не знаю способа обойти это.

Примечание: есть причина, по которой они этого не допускают.Я не специалист в области права, но прежде чем пытаться использовать какие-либо другие методы, я бы проверил, является ли это законным.Особенно, если вы собираетесь использовать это в коммерческих целях.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...