Как я могу получить / напечатать только строки большого многострочного текста в одном теге <p>
, содержащем определенную строку?На сайте строки реализованы с тегами <br>
.Закрывающего тега </p>
нет.
Основная структура сайта:
<p style="line-height: 150%">
I need a big cup of coffee and cookies.
<br>
I do not like tea with milk.
<br>
I can't live without coffee and cookies.
<br>
...
Предположим, я хочу получить / напечатать только строки, содержащие слова «кофе и печенье».Таким образом, в этом случае должна быть напечатана только первая и третья «строка» / предложение этого <p>
.
У меня установлен Beautiful Soup 4.6.3 под Python 3.7.1.
findAll, кажется, ориентирован на теги и возвращает целое <p>
, верно?Так как я могу это понять?Может быть с регулярным выражением или другим шаблоном?