Разбор данных, вложенных в класс Div с использованием ошибки Beautifulsoup - PullRequest
0 голосов
/ 04 ноября 2018

Добрый вечер, стеклопакеты,

Я новичок в Python и пытаюсь узнать больше об этом, поступив в аспирантуру. Недавно я познакомился с замечательной надстройкой BeauifulSoup. Я попытался проанализировать данные о местоположении с сайта недвижимости, который называется «Nestio».

Насколько я понял, я сделал кодировку, как показано ниже.

from bs4 import BeautifulSoup
import requests

source = requests.get('https://nestiolistings.com/listings/?listing_type=10&min_price=2500&max_price=3000').text

soup = BeautifulSoup(source, 'lxml')
address = soup.find_all('span', class_ = 'building-title-content')

print(address)

Коды, которые я получил при проверке с сайта:

enter image description here

После запуска кода отображается только «Нет» ...

Возможная причина того, что я не смог достичь результата, заключается в том, что

- информация от href? или это слишком много вложенных?

Я также пытаюсь получить информацию со страницы 1 до страницы 53. И мне сказали, что мне нужно использовать «Json».

import requests
count = 0
for i in range(53):
    count+=1
    link = 'https://nestiolistings.com/listings/?listing_type=10&min_price=2500&max_price=3000&pageNumber='+str(count)
    req = requests.get(link)
    for i in req.json()['building-title-content']:
        address = (i['building-title-content'])
        print ('Address:', address)

Так что я тоже попробовал код Json, но это не похоже на работу ...

Кто-нибудь знает, как решить эту проблему? Цените заранее. Я боролся с этой проблемой в течение месяца, но до сих пор не понял, как решить эту проблему ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...