Удалите тег <br>из HTML, чтобы получить строку для печати в одну строку с BeautifulSoup - PullRequest
0 голосов
/ 21 марта 2020

Код выглядит примерно так:

<a>
    Some text
    <br>
    Some more text
</a>

Использование BeautifulSoup Я пытаюсь получить текст внутри тега для печати в одну строку, используя a.text

Вывод, который я хочу is:
«Некоторый текст. Некоторый больше текста»

Но вывод, который я получаю:
«Некоторый текст
Некоторый больше текста»

1 Ответ

0 голосов
/ 21 марта 2020

Можно ли использовать библиотеку SimplifiedDo c.

from simplified_scrapy import SimplifiedDoc
html = '''
<a>
    Some text
    <br>
    Some more text
</a>
'''
doc = SimplifiedDoc(html)
print (doc.a.text)

Результат:

Some text Some more text
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...