Класс состоит из четырех частей, разделенных пробелами - PullRequest
0 голосов
/ 26 июня 2018

Я пытаюсь очистить веб-сайт, используя python и красивый суп.Цель состоит в том, чтобы создать CSV-файл с соответствующей информацией (местоположение, размер объекта, аренда ...). Я не уверен на 100%, в чем проблема, но я думаю, что это связано со структурой класса.«Результат match_criteria_and_filters first_listing выделен»

Первая часть кода:

 import requests
 from bs4 import BeautifulSoup
 r= requests.get("https://www.publicstorage.com/storage-search-landing.aspx? 
 location=New+York")
 c=r.content

После этого мне нужно было бы выделить class = result совпадения_criteria_and_filters first_listing.Здесь я не могу этого сделать.

Решения, которые я нашел в других темах, не работали.

 soup.select("result.matches_criteria_and_filters.first_listing.highlighted")

Другая найденная мною возможность - отделиться, но она не сработала.

 soup.find_all(attrs={'class': 'result'})
 soup.find_all(attrs={'class': 'matches_criteria_and_filters'})

Все, что я пробовал, давало пустые или ни одного объекта.

1 Ответ

0 голосов
/ 26 июня 2018

Сначала попробуйте получить родительский div с помощью кода, подобного следующему:

soup = BeautifulSoup('yourhtml', 'lxml')
results_div = soup.find('div', {'id':'results'})
#now iterate through all children divs

, затем делайте все, что вы хотите сделать с дочерними элементами div

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...