Необходимо получить текст между содержащимися в классе - PullRequest
0 голосов
/ 09 апреля 2019

Мне нужно захватить текст от каждого из до конца соответствия. Этот заголовок будет меняться много раз в пределах HTML. Я могу захватить все данные, но есть ли лучший способ сделать это?

<div class="box">
    <a class="visual" href="https://www.example.com">
        <img src="https://www.example.com/img.jpg" alt="image description">
        <h2>Ventura</h2>
    </a>
    <div class="status-row">
        <div class="service">
            <span class="icon nowork"></span> No work                                   
        </div>
        <div class="work">
            <div class="number">0</div> Planned Work
        </div>
    </div>
</div>

    <div class="box">
    <a class="visual" href="https://www.example.com">
        <img src="https://www.example.com/img.jpg" alt="image description">
        <h2>Boston</h2>
    </a>
    <div class="status-row">
        <div class="service">
            <span class="icon disruption"></span> Disruptions                                   
        </div>
        <div class="no-work">
            <div class="number">0</div> No Work
        </div>
    </div>
</div>

    page = requests.get(url,verify=False)
soup = BeautifulSoup(page.text, 'html.parser')

s = 'Ventura'

for x in soup.findAll("div",  {"class": ["box", "status-row"]}):
    z = x.get_text()
    if  s in z.strip():
        print(z)

Есть ли лучший способ сделать это?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...