Я новичок в написании простого кода на Python для очистки данных с веб-страницы. Я нашел именно ту часть HTML, которую я хочу очистить, но она продолжает возвращать «Нет». Это работает для других частей веб-страницы, но не для этой конкретной части
Я использую BeautifulSoup для анализа html, и, поскольку я могу почистить часть кода, я предполагаю, что мне не нужно будет использовать Selenium. Но я все еще не могу найти, как очистить одну конкретную часть.
Вот код Python, который я написал:
import requests
from bs4 import BeautifulSoup
url = 'https://www.rent.com/new-york/tuckahoe-apartments?page=2'
response = requests.get(url)
html_soup = BeautifulSoup(response.text, 'html.parser')
apt_listings = html_soup.find_all('div', class_='_3RRl_')
print(type(apt_listings))
print(len(apt_listings))
first_apt = apt_listings[0]
first_apt.a
first_add = first_apt.a.text
print(first_add)
apt_rents = html_soup.find_all('div', class_='_3e12V')
print(type(apt_rents))
print(len(apt_rents))
first_rent = apt_rents[0]
print(first_rent)
first_rent = first_rent.find('class', attrs={'data-tid' : 'price'})
print(first_rent)
Вот вывод из CMD:
<class 'bs4.element.ResultSet'>
30
address not disclosed
<class 'bs4.element.ResultSet'>
30
<div class="_3e12V" data-tid="price">$2,350</div>
None
«Адрес не разглашается» является правильным и был успешно удален. Я хочу потратить $ 2,350, но он продолжает возвращать «Нет». Я думаю, что я близок к тому, чтобы сделать это правильно, но я просто не могу получить $ 2,350. Любая помощь с благодарностью.