Я пытаюсь извлечь URL для списков со страницы города в AirBnb, используя библиотеки Python 3. Я знаком с тем, как очищать более простые веб-сайты с помощью Beautifulsoup и запрашивать библиотеки.
URL: 'https://www.airbnb.com/s/Denver--CO--United-States/homes'
элемент в html
Если я проверяю элемент ссылки на странице (в Chrome), я получаю:
xpath: "//*[@id="listing-9770909"]/div[2]/a"
selector: "listing-9770909 > div._v72lrv > a"
Мои попытки:
import requests
from bs4 import BeautifulSoup
url = 'https://www.airbnb.com/s/Denver--CO--United-States/homes'
html = requests.get(url)
soup = BeautifulSoup(html.text, 'html.parser')
divs = soup.find_all('div', attrs={'id': 'listing'})
попытка 2:
import requests
from lxml import html
page = requests.get(url)
root = html.fromstring(page.content)
tree = root.getroottree()
result = root.xpath('//div[@id="listing-9770909"]/div[2]/a')
for r in result:
print(r)
Ничто из этого не возвращает ничего. Что мне нужно для извлечения, так это URL для ссылки на страницу. Есть идеи?