Найти разрыв строки в HTML с помощью Python - PullRequest
0 голосов
/ 17 января 2019

Я пытаюсь найти все разрывы строк (br), но также и изменение строк в абзацах (p) html-сайта.У меня есть этот код

breaks = re.findall('br<>\n', html)
print len(breaks)

, но он не работает.Любая помощь

1 Ответ

0 голосов
/ 18 января 2019

Я не совсем уверен, что вы хотите, так как вы не показывает пример входов и выходов.

Но если вы хотите разделить тег <br> ИЛИ перевод строки, вы можете попробовать это:

# included many vairations of the '<br>' tag
breaks = re.findall('<br>|<br/>|<br />|\n', html)
print len(breaks)

Это помогает?

...