Python Beautiful Soup Web Scraping? - PullRequest
0 голосов
/ 13 мая 2018

Я использовал красивый суп и класс_ для очистки. Когда я использовал find, это было нормально, так как я мог использовать get.text (), чтобы найти текст внутри тегов. Однако я хочу получить несколько значений, приведенных ниже.

boal_data = boal_soup(class_="investment-info__item grid__item lap--1-2 desk--1-2")
print (boal_data)

Затем при печати выдается следующее.

[<div class="investment-info__item grid__item lap--1-2 desk--1-2">
<h2 class="fontsize--p">Investment Date</h2>
<p class="fontsize--h3">Apr 2018</p>
</div>, <div class="investment-info__item grid__item lap--1-2 desk--1-2">
<h2 class="fontsize--p">Country</h2>
<p class="fontsize--h3">Netherlands</p>
</div>, <div class="investment-info__item grid__item lap--1-2 desk--1-2">
<h2 class="fontsize--p">Revenue at ACQ.</h2>
<p class="fontsize--h3">€156m</p>
</div>, <div class="investment-info__item grid__item lap--1-2 desk--1-2">
<h2 class="fontsize--p">Employees at ACQ.</h2>
<p class="fontsize--h3">370</p>
</div>]

Я бы хотел добавить следующее.

<p class="fontsize--h3">[this text here] </p>

Как я могу это сделать?

1 Ответ

0 голосов
/ 13 мая 2018

используйте find или find_all , чтобы получить текст тега абзаца. Вы можете попробовать это

soup.find_all("p","fontsize--h3").getText()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...