Как я могу удалить тег html с Python? - PullRequest
0 голосов
/ 06 февраля 2020

Мой код работает. Но единственное, что он также возвращает теги HTML. Есть ли что-нибудь, что я могу добавить к своему FOR l oop, чтобы убрать код HTML?

Вот мой код ниже.

addressNeeded = soup.find("h1", {"style": "font-size: inherit; font-weight: inherit;"})
for x in addressNeeded:
    addressList.append(x)

результат:

['\n', <label class="summary-list__label">
<span itemprop="streetAddress">95 Cooks Drive</span>
</label>, '\n', <span class="summary-list__label summary-list__label--small">
<span itemprop="addressLocality">Westside</span>,
                    <span itemprop="addressRegion">NY</span>
<span itemprop="postalCode">07663</span>

Заранее благодарю!

1 Ответ

0 голосов
/ 06 февраля 2020

Я полагаю, вам следует изменить print(x) на print(x.string), как указано в этом ответе

...